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从 书 语 


在 2006 年 1 月 26 日 公布 的 《国家 中 长 期 科学 和 技术 发 展 规划 纲要 (2006 一 2020 年 )》 
中 ， 指 出 了 信息 技术 将 继续 向 高 性 能 、 低 成 本 、 普 适 计算 和 智能 化 等 主要 方向 发 展 ， 寻 求 新 
的 计算 与 处 理 方式 和 物理 实现 是 未 来 信息 技术 领域 面临 的 重大 挑战 。 纳 米 科技 、 生 物 技术 与 
































认 知 科学 等 多 学 科 的 交叉 融合 ， 将 促进 基于 生物 特征 的 、 以 图 








像 和 自然 语言 


理解 为 基础 的 





“以 人 为 中 心 ” 的 信息 技术 发 展 ， 作 为 信息 学 科 前 沿 技术 要 研究 个 性 化 的 智能 机 器 人 和 人 机 
交互 系统 。 在 国家 科技 发 展 纲 要 中 如 此 描述 信息 技术 的 发 展 方向 ， 这 表明 新 世纪 科学 发 展 的 
特征 是 对 人 的 研究 、 对 人 与 自然 和 谐 相 处 的 研究 ; 其 表现 是 纳米 -生物 -信息 - 认 知 (Nano- 
Bio-Info-Cognition ，NBIC ) 多 学 科 交 叉 、 多 技术 融合 研究 的 突起 ; 是 数字 人 (物理 机 器 人 与 
虚拟 软件 人 的 总 称 ， 数 字 人 与 数字 社会 的 关系 研究 ) 技术 的 趋 于 热门 化 和 普遍 化 。 
以 人 为 本 ， 以 人 与 自然 的 和 谐 相处 为 研究 目标 ; 多 学 科 交 叉 结 合 为 研究 手段 ， 以 人 工科 














学 为 主要 研究 领域 ， 将 是 未 来 若干 年 科学 技术 研究 的 主要 特征 。 





为 了 响应 执行 国家 《科技 发 展 纲要 》， 顺 应 科学 技术 潮流 ， 我 们 萌生 了 编写 “人 工 心理 





与 数字 人 技术 丛书 ”的 想法 ， 和 希望 能 够 对 国家 的 科技 进步 有 所 贡献 。 
“人 工 心理 与 数字 人 技术 丛书 ” 选 题 主 要 包括 以 下 范围 〈 不 局 限于 这 些 范围 ) : 











1) NBIC 技术 ; 
2) 广义 人 工 知 能 技术 ; 
3) 生物 特征 识别 技术 ; 
4) 虚拟 现实 技术 ; 

5) 机 器 人 技术 ; 

6) 虚拟 人 技术 ; 

7) 人 机 交互 技术 ; 

8) 普 适 计算 。 

















“丛书 ”的 选 题 是 开放 的 ， 我 们 息 切 希望 国内 外 同行 专家 学 者 一 起 来 撰写 此 领域 的 学 术 








著作 ， 为 中 华 民族 的 科学 技术 事业 共同 努力 。 
本 丛书 有 如 下 特色 : 
1) 本 丛书 主要 是 前 沿 技术 专题 论著 ， 选 题 内 容 新 颖 ; 








2) 选 题 主要 是 前 沿 技术 ， 重 点 在 于 紧 跟 世界 科技 发 展 新 趋势 ; 





3) 内 容 深入 浅 出 ， 便 于 自学 。 


本 丛书 以 科研 人 员 及 大 专 院 校 师 生 为 主要 读者 ， 也 可 供 工 程 技术 人 员 学 习 前 沿 技术 时 作 





为 参考 。 


从 书 主编 王 志 展 


2 二 


视觉 





量 技术 是 以 现代 光学 为 基础 ， 融 合计 算 机 技术 、 激 》 
等 现代 科学 技术 为 一 体 ， 组 成 光 机 电 一 体 化 综合 测量 系统 。 基 
备 能 够 实现 智能 化 、 数 字 化 、 小 型 化 、 网 络 
测 、 实 时 分 析 与 控制 、 连 续 工人 


前 

















技术 、 图 




















ES 


于 视觉 疯 








攻 和 多 功能 化 ， 








工业 、 农 林业 、 医 学 、 航 空 航天 、 科 学 研究 等 领域 。 


作者 长 期 从 事 视觉 测量 技术 的 研究 及 教学 工作 ， 
为 主要 内 容 ， 对 视觉 测量 的 各 项 关键 技术 进行 了 六 
测量 技术 概述 ”， 
觉 测量 系统 ”， 主 要 介绍 了 系统 的 各 个 组 成 部 分 及 相关 概念 。 第 3 章 














介绍 了 图 像 与 处 理 各 个 阶段 











各 种 检测 与 处 型 


法 。 





时 





“ 双 目 视觉 测 


第 6 章 “ 单 目 视觉 测 
原理 、 模 型 、 参 数 计算 、 标 定 方法 ， 以 及 光 笔 式 三 维 坐标 测量 


三 


三 过 


已 


里 





， 主 要 介绍 


像 机 标定 、 匹 配 等 方法 。 


全 书 由 迷 健 男 副 教授 撰写 和 统 稿 ， 参与 编写 工作 的 还 有 胡 四 泉 、 王 先 梅 、 萤 洋 、 魏 
承 、 黄 伟 明 、 崔 丽 波 、 赵 大 海 、 李 明 、 杨 林 、 杨 请 
本 书 深入 浅 出 ， 内 容 系 统 ， 适 合 从 事 视 觉 测 





用 ， 也 适合 高 


可 





编写 工作 得 到 了 国 


每 





院 校 相关 专 
家 自然 科 
































全 书 以 作者 多 年 的 教学 
细 的 阐述 。 全 书 共 分 七 章 。 第 工 章 “ 视 觉 
主要 介绍 了 视觉 测量 技术 的 基本 概念 、 研 究 历史 与 发 展 趋势 。 第 2 章 “ 视 


像 处 理 与 分 析 技 术 
量 技术 的 检测 仪器 设 
具有 精度 高 、 非 接触 、 在 线 检 
FE 等 特点 ， 能 够 适应 多 种 危险 的 应 用 场合 ， 广 泛 应 用 于 军事 、 





经 验 与 研究 成 果 





“图 








的 各 种 模型 算法 。 第 4 章 “ 图 像 分割 ”， 


”， 主 要 介绍 了 单 目 视觉 测量 的 几何 测量 方法 ， 











像 预 处 
主要 介绍 了 图 像 分 割 的 
EE 方法。 第 5 章 “ 摄 像 机 标定 ”， 主 要 介绍 了 摄像 机 模型 及 几 种 主要 的 标定 方 











了 双 目 立体 视觉 的 原理 、 模 型 、 结 构 参 数 、 疯 


、 朱 文 翔 、 王 开 然 等 。 
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学 基 











金 、 国 








谢 。 由 于 作者 的 水 平 有 限 ， 书 中 难免 有 错误 和 不 足 ， 请 读者 批评 指正 。 
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2 主要 





虚拟 立体 视觉 的 


方法 和 几何 光学 法 等 。 第 7 章 





量 精度 ， 以 及 报 


世 





使 











述 健 男 


2011 年 5 月 29 日 于 北京 科技 大 学 
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第 工 章 ”视觉 测量 技术 概述 








基于 计算 机 视觉 的 视觉 测量 技术 是 近年 来 测量 领域 中 迅速 发 展 起 来 的 加 新 技术 。 它 是 以 
现代 光学 为 基础 ， 融 合计 算 机 技术 、 激 光 技 术 、 图 像 处 理 与 分 析 技 术 等 现代 科学 技术 为 一 
体 ， 组 成 光 机 电 一 体 化 的 综合 测量 系统 。 基 于 视觉 测量 技术 的 检测 仪器 设备 能 够 实现 智能 
化 、 数 字 化 、 小 型 化 、 网 络 化 和 多 功能 化 ， 具 有 精度 高 、 非 接触 、 在 线 检测 、 实 时 分 析 与 控 
制 、 连 续 工 作 等 特点 ， 能 够 适应 多 种 危险 的 应 用 场合 ， 广 泛 应 用 于 军事 、 工 业 、 农 林业 、 医 
学 、 航 空 航天 、 科 学 研究 等 领域 。 视 觉 测 量 的 理论 基础 是 计算 机 视觉 技术 ， 因 此 本 章 首先 介 
绍 计算 机 视觉 相关 知识 ， 在 此 基础 上 对 视觉 测量 技术 进行 概述 和 介绍 。 














1.1 计算 机 视觉 


1.1.1 计算 机 视觉 的 概念 


计算 机 视觉 也 称 为 机 器 视觉 ， 是 指 利用 计算 机 对 采集 的 图 像 或 者 视频 进行 处 理 ， 从 而 代 
替 人 腿 的 视觉 功能 ， 实 现 对 客观 世界 的 三 维 场景 的 感知 、 识 别 和 理解 的 技术 。 也 就 是 说 ， 计 
算 机 视觉 是 一 门 研 究 如 何 使 机 器 实现 “看 ”功能 的 科学 ， 它 不 仅 能 模拟 人 有 眼 的 功能 ， 更 重 
要 的 是 完成 人 眼 所 不 能 胜任 的 工作 。 计 算 机 视觉 是 工程 和 科学 领域 中 的 一 个 富有 挑战 性 研究 
领域 。 计 算 机 视觉 的 研究 范畴 涉及 物理 学 、 数 学 、 光 学 、 计 算 机 科学 、 信 号 处 理学 、 生 物 
学 、 神 经 生理 学 和 认 知 科学 等 ， 是 一 门 综合 性 的 前 治学 科 ， 具 有 广阔 的 应 用 前 景 。 

计算 机 视觉 使 用 计算 机 及 相关 设备 对 生物 视觉 进行 模拟 。 其 主要 任务 是 通过 对 采集 的 图 
像 或 视频 进行 处 理 ， 以 获得 相应 场景 的 三 维 信息 。 

计算 机 视觉 使 用 的 理论 方法 主要 是 基于 几何 、 概 率 、 运 动 学 计算 和 三 维 重 构 等 视觉 计算 
理论 ， 其 基础 包括 射影 几何 学 、 刚 体 运 动 学 、 概 率 论 与 随机 过 程 、 人 工 智 能 等 理论 。 


1.1.2 计算 机 视觉 的 实现 方法 


根据 计算 机 视觉 的 技术 机 理 和 相关 应 用 ， 可 将 其 实现 方法 分 为 两 类 : 

1. 仿生 学 方法 

仿生 学 方法 主要 是 参照 人 类 视觉 系统 的 结构 原理 ， 建 立 视觉 过 程 的 计算 模型 和 相应 的 处 
理 模块 ， 实 现 与 人 类 视觉 系统 类 似 的 或 者 全 部 的 功能 。 例 如 ， 仿 生 眼 、 主 动 视觉 系统 等 都 是 
典型 的 基于 仿生 学 原理 的 计算 机 视觉 系统 。 

2. 工程 学 方法 

工程 学 方法 并 不 刻意 模拟 人 类 视觉 系统 的 内 部 结构 和 工作 过 程 ， 它 主要 是 从 分 析 人 类 视 
觉 过 程 的 功能 着 手 ， 仅 考虑 系统 的 输入 和 输出 ， 并 采用 任何 现 有 的 、 可 行 的 手段 实现 所 需 的 
系统 功能 。 例 如 ， 目 前 广泛 应 用 的 双 目 视觉 测 距 系 统 、 双 目 和 多 目 视觉 空间 三 维 坐 标 测 量 系 
统 等 都 是 典型 的 计算 机 视觉 工程 应 用 系统 。 
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1.1.3 ”计算 机 视觉 技术 的 研究 目标 


背 鉴 人 类 视觉 的 原理 ， 计 算 机 视觉 技术 研究 的 长 远 目 标 是 建立 通用 的 视觉 系统 。 即 利用 
计算 机 对 三 维 场景 的 理解 ， 实 现 人 类 视觉 的 功能 。 其 本 质问 题 是 利用 二 维 图 像 重 构 三 维 物 体 
的 可 视 部 分 。 计 算 机 视觉 技术 的 优势 不 仅 在 于 能 模拟 人 了 眼 的 功能 ， 还 能 完成 人 眼 所 不 能 胜任 
的 工作 。 

根据 计算 机 视觉 技术 的 应 用 领域 ， 目 前 计算 机 视觉 技术 的 研究 目标 主要 体现 在 以 下 两 个 
方面 : 

1. 建成 各 种 专用 视觉 系统 ， 完 成 各 种 实际 场合 提出 的 专门 视觉 任务 

其 技术 原理 是 ， 计 算 机 借助 各 种 图 像 传 感 器 (电荷 耦合 器 件 (CCD) 、 互 补 金属 氧化 物 
半导体 (CMOS) 摄像 器 件 等 ) 获取 场景 图 像 ， 感 知 和 恢复 3D 环境 中 物体 的 几何 结构 、 位 
置 姿 态 、 运 动 信息 等 ， 并 对 客观 场景 进行 识别 、 描 述 、 解 释 ， 进 而 做 出 决策 。 

2. 建立 人 类 视觉 的 功能 模型 和 计算 模型 

即 从 生物 学 角度 进一步 探索 人 脑 和 视觉 系统 的 工作 机 理 ， 加 深 对 人 脑 及 视觉 系统 的 掌握 
和 理解 〈 如 计算 神经 科学 ) ， 其 研究 内 容 主 要 是 生物 学 机 理 。 长 期 以 来 ， 对 于 人 脑 视觉 系统 
已 从 生理 、 心 理 、 神 经 、 认 知 等 方面 进行 了 大 量 的 研究 ， 但 还 远 没 有 揭 开 视觉 过 程 的 全 部 奥 
秘 ， 对 视觉 机 理 的 研究 和 了 解 远 落后 于 对 视觉 信息 处 理 的 研究 和 掌握 。 因 此， 对 人 脑 视觉 的 
充分 理解 将 促进 对 计算 机 视觉 更 深入 的 研究 ， 并 对 计算 机 视觉 系统 提供 坚实 的 生物 理论 基 
础 。 

具体 而 言 ， 计 算 机 视觉 至 少 要 达到 如 下 几 个 目标 : 

1) 根据 一 幅 或 多 幅 二 维 图 像 ， 计 算出 目标 物体 的 几何 参数 ， 如 物体 的 高 度 、 宽 度 、 远 
近 距 离 及 姿态 等 。 

2) 根据 一 幅 或 多 幅 二 维 图 像 ， 计 算出 目标 物体 的 运动 参数 ， 如 物体 的 运动 速度 、 加 速 
度 及 运动 方向 等 。 

3) 根据 一 幅 或 多 幅 二 维 图 像 ， 计 算出 目标 物体 的 表面 物理 特性 ， 如 光滑 与 粗糙 及 纹理 
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4) 根据 多 幅 二 维 图 像 ， 恢 复出 更 大 空间 区 域 的 图 像 ， 如 根据 不 同 角 度 拍摄 的 一 组 相互 
间 存 在 重合 部 分 的 目标 图 像 ， 恢 复出 包含 各 图 像 序 列 信息 的 、 完 整 的 、 高 清晰 的 整个 场景 图 
像 。 图 像 拼接 是 该 目标 的 主要 技术 基础 。 


1.1.4 计算 机 视觉 技术 的 发 展 历 程 


计算 机 视觉 技术 起 源 于 在 20 世纪 350 年 代 ， 经 过 几 十 年 的 发 展 ， 各 种 研究 理论 与 研究 方 
法 层出不穷 ， 研 究 内 容 已 经 从 最 初 的 二 维 图 像 分 析 扩 展 到 当前 的 三 维 复 杂 场 景 理解 ， 并 广泛 
应 用 于 工业 、 农 业 、 军 事 、 医 学 、 教 育 与 娱乐 等 多 个 领域 。 

1. 20 世纪 50 年 代 

统计 模式 识别 的 兴起 ， 标 志 着 计算 机 视觉 技术 研究 的 开始 。 当 时 的 研究 工作 主要 集中 在 
二 维 图 像 的 分 析 、 识 别 和 理解 ， 如 字符 识别 ， 工 件 表面 、 显 微 图 片 和 航空 图 片 的 分 析 和 解释 
等 。 

2. 20 世纪 60 年 代 
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Robert 的 工作 开创 了 以 理解 三 维 场景 为 目标 的 三 维 计算 机 视觉 的 研究 。Robert 将 环境 限 
制 在 所 谓 的 “积木 世界 ”， 即 周围 物体 都 是 由 多 面体 组 成 的 ， 需 要 识别 的 物体 可 以 用 简单 的 
点 、 直 线 、 平 面 的 组 合 表 示 。 通 过 计算 机 程序 从 数字 图 像 中 提取 出 诸如 立方 体 、 横 形体 、 楼 
柱 体 等 多 面体 的 三 维 结构 ， 并 对 物体 形状 及 物体 的 空间 关系 进行 描述 。 

3. 20 世纪 70 年 代 

出 现 了 计算 机 视觉 应 用 系统 ， 并 首次 提出 了 较为 完整 的 计算 机 视觉 理论 。1973 年 英国 
的 Mar 教授 应 邀 在 麻 省 理工 学 院 ( Massachusetts Institute of Technology，MIT) 的 人 工 智 能 实 
验 室 创建 并 领导 了 一 个 以 博士 生 为 主 的 研究 小 组 ， 从 事 视觉 理论 方面 的 研究 。1977 年 ， 
Marr 教授 提出 了 不 同 于 “积木 世界 ”分 析 方 法 的 计算 机 视觉 理论 一 一 Marr 视觉 理论 。 该 理 
论 在 20 世纪 80 年 代 成 为 计算 机 视觉 研究 领域 中 十 分 重要 的 理论 框架 。 

4. 20 世纪 80 年 代 中 期 

计算 机 视觉 技术 获得 迅速 发 展 ， 主 动 视觉 理论 框架 、 基 于 感知 特征 群 的 物体 识别 理论 框 
架 、 视 觉 集 成 理论 框架 等 新 概念 、 新 方法 和 新 理论 不 断 涌现 。 

5. 从 20 世纪 90 年代 至 今 

进入 20 世纪 90 年 代 以 后 ， 计 算 机 视觉 理论 的 发 展 十 分 迅速 ， 已 逐渐 发 展 成 为 一 门 由 计 
算 机 技术 、 控 制 理 论 、 模 式 识别 、 人 工 智能 和 生物 技术 等 众多 领域 交叉 综合 的 新 学 科 。 它 受 
到 了 学 术 界 和 工业 界 的 极 大 重视 ， 在 机 器 人 、 工 业 检测、 空间 遥感 、 医 学 图 像 分 析 、 军 事 导 
航 和 交通 管理 等 诸多 领域 得 到 了 广泛 应 用 ， 而 且 应 用 领域 正在 日 益 扩大 。 


1.1.5 Marr 视觉 理论 简介 


1977 年 ，Marr 教授 首次 从 信息 处 理 的 角度 综合 了 图 像 处 理 、 神 经 生理 学 及 临床 神经 病 
学 等 方面 已 经 取得 的 重要 研究 成 果 ， 提 出 了 第 一 个 较为 完善 的 视觉 理论 框架 。 虽 然 这 个 理论 
还 需要 不 断 改进 和 完善 ， 但 Marr 视觉 理论 对 人 类 视觉 和 计算 机 视觉 的 研究 都 产生 了 深远 的 
推动 作用 。 下 面 简要 介绍 Marr 视觉 理论 的 基本 思想 和 框架 。 

1. Marr 视觉 系统 研究 的 三 个 层次 

Marr 从 信息 处 理 系统 的 角度 出 发 ， 认 为 对 此 系统 的 研究 可 以 分 为 三 个 层次 ， 即 计算 理 
论 层次 、 表 达 与 算法 层次 和 硬件 实现 层次 。 

(1) 计算 理论 层次 

这 一 层次 研究 的 是 视觉 系统 的 计算 目的 与 计算 策略 是 什么 ,或 者 视觉 系统 的 输入 、 输 出 
是 什么 ， 如 何 由 系统 的 输入 求 出 系统 的 输出 。 在 这 一 层次 上 ， 视觉 系统 的 输入 是 二 维 图 像 ， 
输出 则 是 三 维 物体 的 形状 、 位 置 和 姿态 。 视 觉 系统 的 任务 就 是 研究 如 何 建立 输入 和 输出 之 间 
的 关系 和 约束 ， 如 何 由 二 维 图 像 恢复 成 物体 的 三 维 信息 。 

(2) 表达 与 算法 层次 

这 一 层次 进一步 研究 如 何 表达 输入 和 输出 信息 ， 如 何 实现 计算 理论 所 对 应 的 功能 算法 ， 
以 及 如 何 由 一 种 表示 变换 成 男 一 种 表示 。 

(3) 硬件 实现 层次 

这 一 层次 解决 用 硬件 实现 上 述 表达 与 算法 的 问题 ， 如 视觉 系统 的 计算 机 体系 结构 和 具体 
的 计算 装置 及 其 细节 。 

视觉 系统 研究 的 三 个 层次 见 表 1. 1。 

























































































表 1.1 视觉 系统 的 三 个 层次 
























































层次 名 称 含义 和 所 研究 的 问题 
1 计算 理论 层次 什么 是 计算 目的 ,为 什么 要 这 样 计算 
2 表达 与 算法 层次 怎样 实现 计算 理论 ， 什 么 是 输入 输出 表达 ， 用 什么 算法 实现 表达 间 的 变换 
3 硬件 实现 层次 怎样 在 物理 上 实现 表达 和 算法 ， 什 么 是 视觉 系统 计算 结构 的 具体 细节 





2. Marr 视觉 信息 处 理 的 三 个 阶段 
Mar 从 视觉 计算 理论 出 发 ， 将 视觉 系统 分 为 自 下 而 上 的 三 个 阶段 ， 即 视觉 信息 从 最 初 
的 二 维 图 像 原始 数据 到 最 终 三 维 环境 表达 经 历 了 三 个 处 理 阶段 ， 如 图 1. 1 所 示 。 


图 像 | 早期 视 中 期 视 后 期 视 | 3D 描述 
觉 处 理 觉 处 理 觉 处 理 


要 素 图 2.5 维 图 


图 1.1 Marr 视觉 信息 处 理 的 三 个 阶段 

第 一 阶段 是 早期 视觉 处 理 ， 其 目的 是 从 输入 的 原始 图 像 中 抽取 观察 者 周围 景物 表面 的 物 
理 特性 ， 如 距离 、 表 面 方 向 、 材 料 特性 (反射 、 颜 色 、 纹 理 ) 等 ， 并 构成 要 素 图 或 基 元 图 。 
基 元 图 由 二 维 图 像 中 的 边缘 点 、 直 线段 、 有 曲线、 顶点、 纹理 等 基本 几何 元 素 或 特征 组 成 。 这 
一 阶段 包括 边缘 检测 、 双 目 立 体 匹配 、 由 阴影 确定 形状 、 由 纹理 确定 形状 、 光 流 计算 等 。 第 
一 阶段 也 称 为 低层 视觉 阶段 。 

第 二 阶段 是 中 期 视觉 处 理 ， 它 在 以 观测 者 为 中 心 的 坐标 系 中 ， 由 输入 图 像 和 基 元 图 恢复 
场景 可 见 部 分 的 深度 、 法 线 方向 、 轮 廓 等 。 根 据 这 些 描 述 ， 可 以 重建 物体 边界 ， 并 按 表面 和 
体积 分 割 景 物 ， 但 在 以 观察 者 为 中 心 的 坐标 系 中 只 能 得 到 可 见 表 面 的 描述 ， 无 法 得 到 遮挡 表 
面 的 描述 ， 这 还 不 是 真正 的 物体 三 维 表示 。 因 此 Marr 称 之 为 对 环境 的 2. 5 维 描述 ， 即 对 环 
境 部 分 的 、 不 完整 的 三 维 信息 描述 ， 是 以 观察 者 为 中 心 的 坐标 系 中 描述 的 部 分 三 维 物 体形 状 
和 位 置 。 第 二 阶段 也 称 为 中 层 视觉 阶段 。 

第 三 阶段 是 后 期 视觉 处 理 ， 用 2.5 维 图 中 的 表面 信息 建立 适用 于 视觉 识别 的 三 维 形状 描 
述 。 这 个 描述 与 观察 者 的 视角 无 关 。 也 就 是 说 ， 在 以 物体 为 中 心 的 坐标 系 中 ， 用 各 种 符号 和 
几何 结构 来 描述 物体 的 三 维 结构 和 空间 关系 。 第 三 阶段 也 称 为 高 层 视觉 阶段 。 表 1. 2 简单 总 
结 了 视觉 处 理 三 个 阶段 中 的 目的 和 特点 。 

表 1.2 由 图 像 恢复 形状 信息 的 表达 框架 
名 称 目 ”的 基 
图 像 灰 度 表示 图 像 中 每 一 像素 灰 度 值 
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表示 二 维 图 像 中 的 重要 信息 ， 主 要 是 图 像 | 零 交 叉 、 斑 点 、 端 点 和 不 连续 点 、 边 缘 、 有 效 线段 、 组 合 


























基 元 医 

本 中 的 灰 度 变化 位 置 及 其 几何 分 布 和 组 织 结构 | 群 、 曲 线 组 织 、 边 界 

2 5 维 图 在 以 观察 者 为 中 心 的 坐标 系 中 ， 表 示 可 见 局 部 表面 朝向 、 离 观测 者 距离 、 深 度 上 的 不 连续 点 、 表 面 
” ”表面 的 方向 、 深 度 值 和 不 连续 的 轮廓 朝向 的 不 连续 点 





























在 以 物体 为 中 心 的 坐标 系 内 ， 用 由 体积 基 | 分 层次 组 成 若干 三 维 模 型 ， 每 个 三 维 模型 都 是 在 几 个 轴线 
三 维 模型 | 元 和 面积 基 元 构成 的 模块 化 多 层次 表示 ， 描 | 空间 的 基础 上 构成 的 ， 所 有 体积 基 元 和 面积 形状 基 元 都 附着 
述 形状 及 其 空间 组 织 形 式 在 轴线 上 

































































3. Marr 视觉 理论 的 意义 及 不 足 

Marr 视觉 理论 是 计算 机 视觉 研究 领域 的 划时代 成 就 。 几 十 年 来 ， 它 对 图 像 理 解 和 计算 
机 视觉 的 研究 发 展 产 生 了 深远 的 影响 。 但 它 还 不 是 一 个 完善 的 理论 ， 因 为 它 没有 反映 人 类 视 
觉 的 某 些 重要 的 本 质 和 特征 ， 即 人 类 视觉 的 选择 性 和 整体 性 ， 而 且 在 实践 中 也 过 到 了 严重 困 
难 。Marr 视觉 理论 的 不 足 之 处 主要 表现 为 以 下 几 点 : 

1) 框架 中 的 输入 是 被 动 的 ， 给 什么 图 像 ， 系 统 就 处 理 什 么 图 像 ; 

2) 框架 中 的 加 工 目 的 是 不 变 的 ， 只 能 是 恢复 场景 中 物体 的 位 置 和 形状 等 ; 

3) 框架 缺乏 或 未 足够 重视 高 层 知识 的 指导 作用 ; 

4) 整个 框架 中 信息 加 工 过 程 基本 上 是 自 下 而 上 、 单 向 流动 、 没 有 反馈 的 。 研 究 发 现 ， 
在 生物 视觉 系统 中 有 许多 从 高 层 传送 信息 的 神经 纤维 ， 甚 至 视网膜 上 也 有 许多 来 自 中 枢 的 神 
经 ， 给 予 支 配 信息 。 虽 然 上 述 反馈 神经 的 确切 作用 尚 不 明确 ， 但 是 可 以 证 明 视 觉 系 统 应 该 有 
反馈 存在 。 

4. Marr 视觉 理论 框架 的 改进 

针对 Marr 视觉 理论 的 不 足 ， 人 们 提出 了 一 系列 改进 思路 。 

(1) 人 类 视觉 是 主动 的 

人 类 视觉 可 根据 需要 改变 视角 ， 以 帮助 识别 。 主 动 视觉 是 指 视觉 系统 可 以 根据 已 有 的 分 
析 结 果 和 视觉 的 当前 要 求 ， 决 定 摄像 机 的 运动 ， 以 从 合适 的 视角 获取 相应 的 图 像 。 

(2) 人 类 视觉 是 有 选择 的 

人 类 视觉 可 以 注视 (以 较 高 的 分 辩 率 观察 感 兴趣 的 区 域 )， 也 可 以 对 场景 中 的 某 些 部 分 
视而不见 。 

选择 性 视觉 是 指 视觉 系统 可 以 根据 已 有 的 分 析 结 果 和 视觉 的 当前 要 求 ， 决 定 摄像 机 的 注 
意 点 ， 以 获取 相应 的 图 像 。 考 虑 到 这 些 因素 ， 在 改进 框架 中 增加 了 图 像 获 取 模 块 。 该 模块 要 
根据 视觉 的 目的 选择 采集 方式 。 

(3) 人 类 视觉 可 以 根据 不 同 目的 进行 调整 

有 目的 的 视觉 也 称 为 定性 视觉 ， 是 指 视觉 系统 根据 视觉 目的 进行 决策 。 例 如 辨别 完整 的 
恢复 场景 中 物体 的 位 置 和 形状 等 ， 还 是 仅仅 检测 场景 中 是 否 有 某 物体 存在 。 在 很 多 情况 下 ， 
只 需要 定性 结果 就 可 以 了 ， 并 不 需要 复杂 性 高 的 定量 结果 。 因 此 在 改进 框架 中 ， 增 加 了 视觉 
目的 模块 。 

顺便 指出 ， 有 一 种 相关 的 观点 认为 ，Marr 关于 对 场景 先 重 建 、 后 解释 的 思路 可 以 简化 
视觉 任务 ， 但 与 人 的 视觉 功能 并 不 完全 吻合 。 事 实 上 ， 重 建 和 解释 并 不 总 是 串 行 的 。 

(4) 人 类 视觉 由 高 层 知识 指导 

人 类 可 在 仅 从 图 像 获取 部 分 信息 的 情况 下 ， 完 全 解决 视觉 问题 ， 其 原因 是 隐 含 地 使 用 了 
各 种 知识 。 例 如 ， 借 助 计 算 机 辅助 设计 (CAD) 物体 模型 库 资 料 ， 可 获取 物体 形状 信息 ， 
可 帮助 解决 由 单 幅 图 像 恢复 物体 形状 的 困难 。 利 用 高 层 知识 可 解决 低层 信息 不 足 的 问题 ， 所 
以 在 改进 框架 中 ， 增 加 了 高 层 知识 模块 。 

(5) 人 类 视觉 有 反馈 

人 类 视觉 中 前 后 处 理 是 有 交互 作用 的 ， 尽 管 对 这 种 交互 作用 的 机 理 了 解 得 还 不 充分 ， 但 
高 层 知识 和 后 期 处 理 的 反馈 信息 对 早期 处 理 的 作用 是 重要 的 。 从 这 个 角度 出 发 ， 在 改进 框架 
中 增加 了 反馈 控制 流向 模块 。 





























































































































改进 后 的 Marr 视觉 理论 框架 如 图 1. 2 所 示 。 
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图 1.2 改进 后 的 Marr 视觉 理论 框架 

限于 历史 等 因素 ，Marr 没有 研究 如 何 用 数学 方法 严格 地 描述 视觉 信息 的 问题 。 虽 然 他 
较 充分 地 研究 了 早期 视觉 ,但 基本 上 没有 论 及 对 视觉 知识 的 表达 、 使 用 和 识别 等 。 

近年 来 ， 有 许多 试图 建立 计算 机 视觉 理论 框架 方面 的 研究 。Grossberg 宣称 建立 了 一 个 
新 的 视觉 理论 表 观 动态 几何 学 (Dynamic Geometry of Surface Form and Appearance ) 。 它 
指出 感知 的 表面 形状 是 分 布 在 多 个 空间 尺度 上 的 、 多 种 处 理 动 作 的 总 的 结果 ， 因 此 2. 5 维 信 
息 是 不 存在 的 。 从 而 向 Marr 视觉 理论 提出 了 挑战 。 

但 Marr 视觉 理论 使 得 人 们 对 信息 的 研究 有 了 明确 的 内 容 和 较 完 整 的 基本 体系 ， 仍 被 看 
作 是 研究 的 主流 。 现 在 新 提出 的 理论 框架 均 包含 它 的 基本 成 分 ， 多 数 被 看 作 是 它 的 补充 和 发 
展 。 尽 管 Marr 视觉 理论 在 许多 方面 还 存在 争议 , 但 至 今 它 仍 是 广大 计算 机 视觉 工作 者 普遍 
接受 的 计算 机 视觉 理论 基本 框架 。 


1.1.6 “计算 机 视觉 技术 的 主要 研究 内 容 


1. 计算 机 视觉 技术 的 研究 内 容 

下 面 从 图 像 输入 设备 、 低 层 视觉 、 中 层 视 觉 、 高 层 视觉 和 体系 结构 五 个 方面 介绍 计算 机 
视觉 技术 的 主要 研究 内 容 。 

(1) 图 像 输 入 设备 (Input Device) 

输入 设备 包括 成 像 设 备 和 数字 化 设备 。 成 像 设 备 是 指 通 过 光学 系统 或 红外 、 激 光 、 超 
声 、X 射线 等 技术 对 周围 场景 或 物体 进行 探测 成 像 。 之 后 通过 数字 化 设备 得 到 关于 场景 或 物 
体 的 二 维 或 三 维 数字 化 图 像 的 装置 。 

(2) 低层 视觉 (Low Level Vision) 

低层 视觉 主要 对 输入 的 原始 图 像 进 行 处 理 。 这 一 过 程 借用 了 大 量 的 图 像 处 理 技术 和 算 
法 ， 如 图 像 滤波 、 图 像 增强 、 图 像 边 绿 检测、 图 像 纹 理 检测 等 ， 以 便 从 图 像 中 抽取 诸如 角 
点 、 边 缘 、 线 条 、 边 界 及 色彩 等 关于 场景 的 基本 特征 。 这 一 过 程 还 包括 了 各 种 图 像 变 换 
(如 校正 ) 、 图 像 压 缩 、 图 像 运动 检测 等 。 

(3) 中 层 视 觉 (Intermediate Level Vision) 

中 层 视 觉 的 主要 任务 是 恢复 场景 的 深度 、 表 面 法 线 方向 、 轮 廊 等 有 关 场 景 的 2.5 维 信 
息 。 实 现 的 途径 有 立体 视觉 (Stereo Vision) 、 测 距 成 像 (Range Finder) 、 运 动 估计 (Motion 
Estimation) 等 。 系 统 标定 等 研究 内 容 一 般 也 在 这 个 层次 上 进行 。 

(4) 高 层 视 党 (Heigh Level Vision ) 

高 层 视觉 的 主要 任务 是 在 以 物体 为 中 心 的 坐标 系 中 ， 在 原始 输入 图 像 、 图 像 基 本 特征 、 
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2.5 维 图 的 基础 上 ， 恢 复出 物体 的 完整 三 维 图 ， 建 立 物体 三 维 描述 ， 识别 三 维 物 体 ， 并 确定 
物体 的 位 置 和 方向 等 。 

(5) 体系 结构 (System Architecture) 

体系 结构 这 一 术语 最 通常 的 含义 是 指 在 高 度 抽象 的 层次 上 ， 根据 系统 模型 而 不 是 根据 事 
先 设计 的 具体 例子 来 研究 系统 的 结构 。 为 了 说 明 这 一 点 ， 可 以 考虑 建筑 设计 中 某 一 时 期 的 建 
筑 风 格 (如 清朝 时 期 ) 和 根据 这 一 风格 设计 出 来 的 具体 建筑 之 间 的 区 别 。 体 系 结构 研究 涉 
及 一 系列 相关 的 课题 ， 包 括 并 行 结构 、 分 层 结构 、 信 息 流 结构 、 拓 扑 结构 ， 以 及 从 设计 到 实 
现 的 途径 。 

2. 图 像 工 程 

(1) 概念 
图 像 工 程 是 有 关 图 像 的 理论 和 技术 ， 是 对 图 像 数据 的 分 析 、 管 理 及 各 种 应 用 的 总 称 。 
1) 多 年 来 ， 图 像 技 术 有 了 迅猛 的 发 展 ， 受 到 了 广泛 的 重视 和 关注 ， 出 现 了 许多 新 理 
论 、 新 方法 、 新 技术 、 新 手段 、 新 设备 。 它 要 求 图 像 技术 工作 在 一 个 整体 的 框架 下 进行 。 
2) 图 像 技 术 多 年 来 的 发 展 和 积累 ， 为 图 像 工程 学 科 打 下 了 坚实 的 基础 ， 各 类 图 像 应 用 
也 对 图 像 工 程 学 科 的 建立 提出 了 迫切 的 需要 。 图 像 工 程 成 为 整个 图 像 领域 进行 研究 和 应 用 的 
新 学 科 。 

(2) 图 像 工 程 的 内 容 

图 像 工程 按照 抽象 程度 和 研究 方法 可 分 为 三 个 层次 : 图 像 处 理 、 图 像 分 析 和 图 像 理 解 。 
图 像 工 程 是 三 者 既 有 联系 又 有 区 别 的 有 机 结合 体 。 

1) 图 像 处 理 广义 图 像 处 理 泛 指 各 种 图 像 技 术 ， 实 际 上 着 重 强调 在 图 像 之 间 的 变换 。 
狭义 图 像 处 理 是 指 图 像 进行 各 种 加 工 ， 以 改善 图 像 的 视觉 效果 ， 并 为 自动 识别 打下 基础 ; 或 
对 图 像 进行 压缩 编码 ， 以 减少 对 所 需 存 储 空间 和 传输 时 间 、 传 输 通路 的 要 求 。 图 像 处 理 研究 
内 容 包 括 图 像 采集 和 获取 、 图 像 重 建 、 图 像 变 换 、 图 像 滤 波 、 图 像 增强 、 图 像 恢复 或 复原 
等 。 



































2) 图 像 分 析 ”对 图 像 中 比较 感 兴趣 的 目标 进行 检测 和 测量 ， 以 获得 它们 的 客观 信息 ， 
从 而 建立 对 图 像 的 描述 。 图 像 分 析 的 特点 是 一 个 从 图 像 到 数据 的 过 程 。 数 据 可 以 是 对 目标 特 
征 测量 的 结果 ， 或 是 基于 测量 的 符号 表示 。 它 描述 了 图 像 中 目标 的 特点 和 性 质 。 图 像 分 析 的 
研究 内 容 包括 图 像 分 割 、 图 像 的 目标 表达 和 描述 、 图 像 检测 与 测量 、 图 像 的 目标 形状 、 图 像 
的 纹理 、 图 像 的 运动 分 析 、 图 像 的 目标 识别 等。 

3) 图 像 理解 ”在 图 像 分 析 的 基础 上 ， 进 一 步 研究 图 像 中 各 目标 的 性 质 和 它们 之 间 的 相 
互联 系 ， 并 得 出 对 图 像 内 容 含义 的 理解 及 对 客观 场景 的 解释 ， 从 而 指导 和 规划 行动 。 图 像 理 
解 的 研究 内 容 包括 图 像 匹 配 、 图 像 三 维 (3D) 建 模 、 图 像 客观 场景 恢复 、 图 像 解 释 和 推理 
等 。 

(3) 小 结 
图 像 处 理 、 图 像 分 析 和 图 像 理解 是 处 在 三 个 抽象 程度 和 数据 量 各 有 特点 的 三 个 不 同 层次 
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上 。 








图 像 处 理 是 底层 操作 ， 它 主要 在 图 像 的 像素 级 上 进行 处 理 ， 人 处 理 数 据 量 大 。 图 像 处 理 是 
一 个 从 图 像 到 图 像 的 过 程 。 
图 像 分 析 是 中 层 操作 ， 通 过 分 割 和 特征 提取 ， 把 原来 以 像素 描述 的 图 像 转 变 成 比较 简洁 
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的 非 图 像 形式 的 描述 。 
图 像 理 解 主要 是 高 层 操作 ， 基 本 上 是 对 从 描述 抽象 出 来 的 符号 进行 运算 ， 其 处 理 方法 与 
人 类 的 思维 推理 有 许多 类 似 之 处 。 


图 1. 3 所 示 为 图 像 工程 的 三 层次 示意 。 


驻 现 












































高 层 符号 ) 
梨 | 活 作 | 数 
二 二 a 
程 义 < 中 层 日 标 > 对 据 
度 象 “| 量 
低层 像素 | 
低 大 


图 1.3 图 像 工 程 的 三 层次 示意 
1.1.7 计算 机 视觉 系统 的 构成 


如 图 1.4 所 示 ， 计 算 机 视觉 系统 以 计算 机 为 中 心 ， 一 般 由 光源 、 图 像 传感器 〈 包 括 光 学 
成 像 系 统 、 光 电 转换 装置 ) 、 图 像 采集 装置 、 图 像 处 理 系统 (包括 专用 图 像 处 理 系 统 与 计算 
机 图 像 处 理 系 统 ) 组 成 。 随 着 网 络 技术 的 发 展 ， 网 络 化 的 视觉 系统 已 经 应 用 到 诸如 大 型 制 
造 业 、 盏 事 、 空 间 技术 等 领域 ， 这 里 的 信息 传输 系统 (包括 各 种 有 线形 式 与 无 线形 式 ) 也 
是 视觉 系统 的 重要 组 成 部 分 。 在 实际 应 用 中 ， 根 据 不 同 的 任务 和 应 用 目标 ， 各 类 视觉 系统 在 
构成 方面 会 略 有 差异 。 


| 装置 
图 像 传感器 





















到 1.4 计算 机 视觉 系统 构成 示意 

















1. 图 像 传感器 

图 像 传感器 是 整个 视觉 检测 系统 的 感觉 部 分 ， 主 要 包括 光学 成 像 系统 、 光 电 转 换 装置 和 
摄像 机 控制 系统 三 个 部 分 。 

光学 成 像 系统 将 真实 物体 的 景象 投影 到 摄像 机 的 像 平 面 上 ， 其 主要 参数 有 焦距 、 视 角 、 
放大 倍率 、 景 深 和 线性 度 等 ， 对 检测 系统 的 性 能 有 重要 影响 。 

摄像 机 控制 系统 接收 反馈 控制 系统 的 信号 ， 主 要 用 来 实现 摄像 机 的 精确 运动 控制 和 参数 
的 调整 。 

光电 转换 装置 将 接收 到 的 光 信 息 转 成 电信 号 ， 是 构成 计算 机 视觉 系统 的 核心 部 件 。 光 电 
转换 装置 主要 有 电荷 耦合 器 件 (Charge Coupled Device, CCD) 和 互补 金属 氧化 物 半导体 





(Complementary Metal-Oxide Semiconductor，CMOS) 上 需 件 。 

CCD 是 目前 计算 机 视觉 系统 中 最 为 常用 的 摄像 器 件 。 它 集 兴 电 转 换 及 电荷 存储 、 电 和 荷 
转移 、 信 号 读 取 于 一 体 ， 是 典型 的 固体 成 像 器 件 。 不 同 于 其 他 器 件 以 电流 或 者 电压 为 信和 号， 
CCD 的 突出 特点 是 以 电荷 为 信号 。 这 类 摄像 器 件 通过 光电 转换 形成 电荷 包 ， 之 后 在 驱 劲 脉 
冲 的 作用 下 转移 、 放 大 输出 图 像 信 号 。 典 型 的 CCD 摄像 机 由 光学 镜头 、 时 序 及 同步 信号 发 
生 右 、A-D 信号 处 理 电 路 组 成 。CCD 作为 一 种 功能 器 件 在 计算 机 视觉 的 发 展 和 应 用 中 起 着 
至 关 重 要 的 作用 。 

CMOS 融 件 的 开发 最 早出 现在 20 世纪 70 年 代 初 。20 世纪 90 年 代 初 期 随 着 超大 规模 集 
成 (Very Large Scale Entegrated，VLSI) 电路 制造 工艺 技术 的 发 展 ，CMOS 需 件 得 到 迅速 发 
展 。 与 CCD 相 比 ，CMOS 器 件 的 优点 可 概括 如 下 : 可 以 实现 窗口 、 子 样 和 随机 像素 存 取 ; 
无 需 专用 驱动 电路 ; CMOS 器 件 将 光敏 单元 阵列 、 图 像 信 号 放大 器 、 信 和 号 读 取 电 路 、A-D 转 
换 电路 、 图 像 信号 处 理 器 及 控制 器 集成 在 一 块 芯片 上 ， 因 此 易 与 信号 转换 和 处 理 电 路 实现 单 
片 集 成 ; 功 耗 极 低 ， 且 无 需 制冷 ; 抗 辐射 性 能 好 ; 动态 范围 宽 ; CMOS 芯片 成 本 只 相当 于 同 
类 CCD 芯片 的 10% ~30%。 可 以 预计 ， 以 其 独特 的 优点 ，CMOS 器 件 在 计算 机 视觉 系统 中 
将 有 广阔 的 应 用 前 景 。 

2. 图 像 采 集 系统 

图 像 采集 系统 由 专用 视频 解码 右 、 图 像 缓 冲 瘟 和 接口 控制 电路 构成 。 它 的 主要 功能 是 将 
摄像 系统 生成 的 视频 信号 实时 地 转换 成 便于 计算 机 处 理 的 数字 图 像 信 号 。 随 着 专用 视频 解码 
芯片 的 出 现 和 现场 可 编程 门 阵列 ( Field Programmable Gate Array，FPGA) 器 件 的 普遍 应 用 ， 
使 得 图 像 采集 装置 只 需要 很 少 的 几 个 芯片 就 可 以 完成 图 像 数 据 的 实时 高 速 转换 。 所 以 ， 有 些 
图 像 采集 装置 集成 了 显示 功能 ， 可 以 实现 高 质量 图 像 的 实时 显示 。 一 些 高 档 图 像 采 集 装 置 还 
带 有 数字 信和 号 处 理 器 (Digital Signal Processor，DSP) 处 理 功 能 ， 在 对 图 像 数据 进行 预 处 理 ， 
如 快速 傅 里 叶 变 换 ( Fast Fourier Transform，FFT) 后 ， 再 传输 到 计算 机 ， 使 得 后 续 的 图 像 处 
理工 作 的 运算 速度 得 到 大 幅度 提高 。 在 以 个 人 计算 机 (Personal Computer，PC) 为 主 的 视觉 
检测 系统 中 ， 图 像 采 集 装 置 一 般 以 板 卡 的 形式 出 现 ， 因 而 有 时 称 其 为 图 像 采 集 卡 。 图 像 采集 
卡 一 般 通 过 64 位 的 外 围 设备 接口 (Peripheral Component Interconnect，PCI) 总 线 实现 与 计算 
机 的 通信 。 随 着 标准 通用 接口 数据 传送 速率 的 提高 ， 近 年 来 出 现 了 基于 通用 串 行 总 线 (Uni- 
versal Serial Bus，USB) 接口 的 图 像 采集 卡 ， 具 备 了 即 插 即 用 能 力 ， 为 计算 机 视觉 检测 技术 
的 实验 研究 创造 了 极为 方便 的 条 件 。 在 组 建 视觉 检测 系统 过 程 中 ， 要 注意 图 像 采 集 卡 允许 的 
输入 信号 与 摄像 机 的 输出 (如 视频 信号 或 彩色 RGB 信和 号 等 信号 类 型 ) 的 一 致 性 ， 同 时 还 要 
考虑 采样 速度 、 分 辨 率 等 参数 。 合 理 的 性 能 选择 与 参数 配置 对 提高 视觉 检测 系统 整体 性 价 比 
具有 较 大 的 益处 。 

3. 专用 图 像 处 理 系统 

专用 图 像 处 理 系 统 是 计算 机 的 辅助 处 理 器 ， 主 要 采用 专用 集成 电路 ( Application Specific 
Integrated Ciruit，ASIC) 芯片 、 数 字 信 号 处 理 器 (DSP) 或 者 FPGA 器 件 等 设计 的 全 硬件 处 
理 器 。 其 主要 功能 是 实时 高 速 地 完成 各 种 底层 计算 机 图 像 处 理 功能 ,例如 图 像 的 缩放 、 滤 
波 、 增 强 、 边 缘 提 取 等 。 其 目的 是 提高 整个 计算 机 视觉 系统 的 处 理 速度 。 专 用 图 像 处 理 系 统 
与 计算 机 之 间 的 通信 可 以 采用 标准 总 线 接口 、 串 行 通信 总 线 接口 或 者 网 络 通信 等 形式 。 

4. 计算 机 及 其 图 像 处 理 系统 
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计算 机 作为 整个 视觉 测量 系统 的 核心 ， 不 仅 要 控制 整个 系统 的 各 个 模块 的 正常 运行 ， 还 
承担 着 视觉 系统 最 后 结果 的 运算 和 输出 。 由 图 像 采集 系统 输出 的 数字 图 像 可 以 直接 传送 到 计 
算 机 ， 由 计算 机 采用 软件 方式 完成 所 有 图 像 的 处 理 和 其 他 计算 。 如 果 软 件 处 理 不 能 够 满足 视 
觉 系 统 的 要 求 ， 则 需要 使 用 专用 硬件 处 理 系 统 ， 实 时 高 速 地 完成 各 种 低层 次 的 图 像 处 理 算 
法 ， 从 而 减轻 计算 机 的 处 理 负 从 ， 提 高 整个 计算 机 视觉 测量 系统 的 速度 。 

随 着 技术 的 发 展 ， 摄 像 系统 、 图 像 采集 系统 已 经 可 以 实现 高 度 集成 ， 例 如 各 种 数字 摄像 
机 的 出 现 就 是 一 个 实例 。 而 且 对 于 一 个 实用 的 计算 机 视觉 系统 而 言 ， 其 结构 、 性 能 、 处 理 时 
间 和 价格 等 均 应 该 根据 具体 应 用 情况 进行 灵活 的 选择 。 


1.1.8 计算 机 视觉 技术 的 应 用 领域 


随 着 技术 的 发 展 ， 计 算 机 视觉 技术 已 广泛 应 用 于 工业 自动 化 生产 线 、 各 类 检验 和 监视 、 
视觉 导航 、 图 像 自 动 解释 、 人 机 交互 与 虚拟 现实 等 各 个 领域 。 

1. 在 产品 的 分 类 与 检测 

计算 机 视觉 中 的 应 用 技术 已 成 功 地 应 用 于 工 、 农 、 林 等 各 个 领域 的 产品 分 类 检测 ， 不 但 
大 幅 提高 了 产品 的 质量 和 可 靠 性 ， 而 且 提 高 了 生产 效率 。 

在 工业 生产 中 ， 计 算 机 视觉 技术 可 以 自动 检测 各 种 机 械 零 件 的 几何 尺寸 ,测量 其 精度 范 
围 ， 目 前 已 经 用 于 产品 外 形 检验 、 表 面 缺 陷 检 验 等 。 例 如 ， 对 滑 块 及 滑 槽 外 形 的 检验 及 装配 
后 位 置 的 检验 ， 可 以 决定 它们 能 否 装配 在 一 起 ， 并 且 准 确 无 误 地 完成 装配 任务 ;对 发 动机 内 
壁 麻 点 、 刻 痕 等 缺陷 的 检查 ， 可 以 决定 产品 的 质量 ; 通过 X 射线 照相 或 超声 探测 获取 物体 
内 部 的 图 像 ， 可 以 实现 内 部 缺陷 检验 ， 如 钢 梁 内 部 裂纹 和 气孔 等 缺陷 检验 。 另 外 ， 计 算 机 视 
觉 还 可 对 零 部 件 文 字 标识 进行 检测 与 识别 。 序 列 号 由 数字 、 字 母 和 汉字 等 组 成 ， 以 数字 和 字 
母 居 多 ， 作 为 零 部 件 的 惟一 身份 标志 ， 通 常 打印 在 电子 元 器 件 、 集 成 电路 板 、 大 型 工件 成 品 
的 外 表面 上 上。 这些 序列 标号 或 编码 ， 如 采用 人 工 方式 用 眼睛 对 这 些 字符 进行 观察 识别 ， 将 不 
能 满足 高 效率 、 自 动 化 生产 的 要 求 ， 并 且 字 符 在 工件 上 的 位 置 很 多 时 候 不 便于 人 有 眼 观察 ， 人 
眼 疫 劳 因素 也 会 使 检测 结果 不 能 从 根本 上 得 到 保证 。 采 用 计算 机 视觉 、 模 式 识 别 、 智 能 控制 
等 技术 可 以 有 效 地 克服 上 述 缺 点 ， 完 成 文字 标识 的 自动 检测 与 识别 ， 提 高 生产 效率 ， 实 现 和 后 
产 过 程 自动 化 。 

在 纺织 、 印 染 业 中 ， 计 算 机 视觉 技术 可 以 完成 自动 分 色 、 配 色 和 产品 成 分 与 瑕 症 检 验 等 
工作 。 例 如 ， 利 用 计算 机 视觉 来 进行 羊毛 的 细 度 和 羊绒 羊毛 的 纤维 含量 分 析 ， 或 对 织造 布 、 
非 织造 布 、 丝 绸 的 质量 和 工艺 作出 分 析 。 

计算 机 视觉 在 农林 业 生产 中 的 应 用 也 日 益 广 泛 ， 主 要 表现 在 : 

1) 利用 计算 机 视觉 技术 根据 检测 到 的 农产品 的 颜色 、 纹 理 等 信息 对 其 进行 分 级 、 检 验 
和 分 类 。 例 如 ， 根 据 检 测 到 的 粒 型 、 至 白 度 等 参数 ， 将 稻米 分 为 不 同等 级 ; 根据 检测 到 的 农 
作物 的 叶片 信息 ， 可 以 对 不 同 的 农作物 进行 分 类 ; 根据 检测 到 的 颜色 、 形 状 等 信息 ， 对 苹 
果 、 柑 橘 等 水 果 进 行 分 类 。 

2) 利用 计算 机 视觉 技术 进行 病虫害 的 监测 。 例 如 ， 根 据 检测 到 的 棉花 叶片 的 图 像 信 
息 ， 用 轮廓 跟踪 的 方法 确定 棉花 叶片 上 的 虫 蚀 痕 迹 ， 对 棉花 生长 过 程 中 棉铃 虫 虫 害 的 发 病程 
度 进 行 诊断 。 

3) 利用 计算 机 视觉 技术 对 育苗 、 栽 培 、 管理 和 收获 等 各 个 环节 进行 自动 化 管理 等 。 例 
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如 ， 农 作物 长 势 是 农作物 田间 管理 的 核心 内 容 ， 可 以 通过 检测 到 的 颜色 、 形 状 、 纹 理 、 叶 面 
耻 、 荃 粗 、 叶 柄 角度 、 苗 高 、 节 距 、 叶 片 反 射 特性 等 信息 对 农作物 长 势 进行 无 损 监 测 或 者 分 
析 农 作物 的 营养 状况 ; 根据 检测 到 的 农产品 的 尺寸 、 面 积 、 颜 色 等 信息 指导 机 械 手 进行 自动 
收割 、 摘 取 。 

4) 利用 计算 机 视觉 技术 对 家 畜 进 行 跟踪 、 饲 养 和 管理 。 例 如 ， 在 饲养 场 ， 可 以 通过 视 
觉 技术 对 实行 放养 管理 的 猪 进行 跟踪 管理 ; 根据 检测 到 的 奶牛 的 体形 ， 可 以 确定 其 与 产 奶 量 
等 指标 之 间 的 关系 。 

5) 利用 计算 机 视觉 技术 对 林业 生产 中 木材 的 品质 进行 检测 ， 如 板材 厚度 与 体积 检测 、 
板材 表面 粗糙 度 检 测 、 木 材 材 质 及 微观 构造 分 析 、 板 材 表面 缺陷 检测 、 树 种 的 识别 和 苗木 参 
数 测量 等 。 

2. 在 医学 中 的 应 用 

在 医学 领域 ,计算 机 视觉 用 于 辅助 医生 进行 医学 影像 的 分 析 ， 主 要 利用 数字 图 像 处 理 技 
术 、 信 息 融 合 技术 对 X 射线 透视 图 、 核 磁 共 振 图 像 、 计 算 机 层 析 成 像 技术 ( Computer Tomo- 
graphy，CT) 图 像 进行 适当 又 加 ， 然 后 进行 综合 分 析 ; 对 其 他 医学 影像 数据 进行 统计 和 分 
析 ， 如 利用 数字 图 像 的 边缘 提取 与 图 像 分 割 技术 ， 自 动 完成 细胞 个 数 的 技术 或 统计 ， 这 样 不 
仅 节 省 了 人 力 ， 而 且 大 大 提高 了 准确 率 和 效率 。 

3. 在 视觉 导航 中 的 应 用 

(1) 导弹 精确 制导 

导弹 的 视觉 导航 主要 应 用 于 导弹 接近 目标 时 的 末 段 制导 ， 即 在 导弹 的 前 部 加 装 红 外 和 可 
见 光 探测 器 ， 用 于 检测 和 识别 目标 ， 为 导弹 攻击 提供 目标 参数 。 

有 些 国家 投入 了 大 量 的 人 力 、 物 力 和 财力 开展 视觉 仿生 技术 在 军事 领域 的 应 用 研究 。 到 
目前 为 止 ， 国 内 外 学 者 对 人 类 和 其 他 生物 的 视觉 机 理 进 行 了 大 量 研 究 ， 并 取得 了 丰硕 的 成 
果 。 在 生物 视觉 机 制 及 仿生 技术 方面 研究 较 多 的 是 鳌 、 蛙 和 晶 等 动物 复眼 视觉 系统 及 人 眼 视 
党 系统 。 鹰 眼 以 其 视野 宽 、 目 光敏 锐 著 称 ， 能 在 高 空 从 许多 相对 运动 的 复杂 背景 中 发 现 并 捕 
捉 目 标 。 对 应 眼 视觉 原理 进行 分 析 ， 建 立 应 眼 视觉 模型 ， 这 在 军事 领域 中 具有 广阔 的 应 用 前 
怀 o 

(2) 无 人 机 驾驶 

无 人 机 是 无 人 驾驶 飞行 器 (Unmanned Aerial Vehicle，UAV) 的 简称 ， 如 图 1.5 所 示 。 
它 是 由 航模 无 人 机 发 展 而 成 的 ， 是 一 种 靠 无 线 电 般 控 或 按 输入 程序 自主 控制 飞行 ， 有 动力 、 
可 控制 ， 能 携带 多 种 任务 设备 ， 执 行 多 种 任务 ， 并 能 重复 使 用 的 无 人 驾驶 航空 器 。 它 主要 由 
机 体 、 动 力 系 统 、 机 内 制导 与 控制 系统 、 起 飞 和 回收 装置 ， 以 及 侦察 、 电 子 设备 等 组 成 。 在 
现代 战争 中 ， 无 人 机 发 挥 着 举足轻重 的 作用 。 因 为 无 人 机 不 仅 具 有 得 天 独 厚 的 “无 人 ” 优 
势 和 侦察 、 打 击 、 评 估 等 “多 面 手 ” 功 能 ， 而 且 也 越 来 越 符 合 现代 化 战争 的 新 特点 ， 即 
“ 非 接触 ”和 “ 零 伤亡 ”的 战争 理念 。 除 了 在 军事 上 扮演 了 重要 角色 ,无 人 机 在 民用 上 也 有 
着 广阔 的 应 用 前 途 ， 可 应 用 于 场 区 监控 、 地 球 物理 探矿 、 气 象 探测 、 公 路 巡视 、 勘 探测 绘 、 
灾情 监视 、 航 空 摄 影 、 交 通 管理 、 电 力 线路 巡查 、 和 森林 火灾 防 救 等 。 

无 人 机 导航 是 无 人 机 技术 的 重要 组 成 部 分 ， 基 于 计算 机 视觉 的 无 人 机 导航 技术 是 目前 无 
人 机 导航 领域 的 研究 热点 。 它 涉及 计算 机 视觉 的 目标 捕获 、 定 位 、 跟 踪 及 测 距 等 。 基 于 计算 
机 视觉 的 导航 装置 利用 传感器 获取 航向 附近 的 物体 信息 ， 对 获取 的 图 像 进行 图 像 处 理 、 图 像 
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分 析 ， 通 过 对 拍摄 的 景物 进行 识别 及 与 已 有 的 地 形 知识 进行 匹配 等 手段 来 确定 航行 装置 准确 
位 置 。 











图 1.5 无 人 机 








(3) 智能 车 辆 

为 解决 日 益 拥 堵 的 交通 问题 ， 世 界 各国 广 泛 开 展 智能 交通 系统 (Intelligent Transportation 
System，ITS) 的 研究 。 智 能 车 辆 作为 其 中 的 重要 组 成 部 分 越 来 越 受 到 人 们 的 关注 。 智 能 车 
辆 技术 的 关键 是 快速 准确 地 利用 车 载 传感器 获取 前 方 道路 环境 信息 。 通 常 采 用 的 检测 技术 包 
括 计算 机 视觉 技术 、 雷 达 技 术 、 磁 性 导航 技术 等 。 其 中 ， 视 觉 传感器 与 其 他 传 感 方式 相 比 具 











有 如 下 特点 : 中 图 像 信息 含量 丰富 ， 信 息 获 取 面 积 大 ， 可 同时 实现 道路 检测 和 障碍 物 识别 ; 
@) 视 觉 传感器 属于 被 动 传感器 ， 无 需 破坏 路 面 和 对 现 有 道路 设施 进行 变动 ; @) 无 需 与 道路 或 
其 他 车 辆 进行 交流 ， 即 可 获得 比较 完整 的 路 况 和 车 辆 信息 ， 维 护 费 用 低 ， 且 不 会 对 环境 造成 
污染 。 因 此 ， 计 算 机 视觉 技术 非常 适合 于 道路 的 检测 与 跟踪 。 在 车 辆 辅助 驾驶 或 自动 驾驶 系 
统 中 ， 视 觉 传感器 如 人 的 眼睛 一 样 ， 可 以 检测 出 道路 信息 和 障碍 物 信 息 与 车 辆 的 相对 关系 ， 
进一步 运用 控制 系统 来 掌控 车 辆 的 驾驶 行为 。 目 前 ， 典 型 的 基于 计算 机 视觉 技术 的 车 辆 导航 
系统 有 美国 卡耐基 梅 隆 大 学 的 Navlab 智能 车 的 RALPH 视觉 导航 系统 ， 意 大 利 帕 尔 玛 大 学 的 
ARGO 智能 车 的 COLD 视觉 系统 ， 德 国联 邦 国防 大 学 的 VaMoRs 智能 车 的 BVV 视觉 系统 等 。 

(4) 移动 机 器 人 

移动 机 器 人 是 一 种 集 环境 感知 、 动 态 决 策 与 规划 、 行 为 控制 与 执行 等 多 种 功能 于 一 体 的 
综合 系统 ， 在 机 器 人 学 领域 中 占有 重要 的 地 位 。 在 移动 机 器 人 的 各 项 研究 和 应 用 中 ， 导 航 
(Navigation) 是 最 基本 和 最 重要 的 问题 。Durant Whyte H 等 人 将 机 器 人 的 导航 研究 归结 》 
“我 在 哪里 (Where am 1)?”、“ 我 要 去 哪里 (Where am I going)?” 及 “如 何 到 达 那 里 (How 
do I get there )?” 三 个 问题 ， 即 定位 、 目 标识 别 、 路 径 规划 三 大 问题 。 其 中 解决 “我 在 哪 
里 ?” 问 题 的 自主 定位 是 移动 机 器 人 技术 的 基本 环节 。 

为 了 实现 导航 的 基本 任务 ， 移 动机 器 人 需要 依靠 本 身 装 配 的 传感器 实现 对 内 部 本 体 姿 态 
和 外 部 环境 信息 的 感知 ， 对 于 传 感 右 采集 到 的 数据 ， 经 过 融合 处 理 ， 并 以 精炼 的 知识 表达 实 
现 对 环境 空间 的 描述 ; 通过 这 些 环 境 空间 信息 的 存储 、 识 别 、 搜 索 等 操作 ， 寻 找 最 优 或 近似 
最 优 的 无 碰撞 路 径 而 实现 安全 的 运动 。 

移动 机 器 人 在 完成 准确 的 本 身 定位 之 后 ， 可 采用 的 具体 导航 方式 包括 电磁 导航 、 光 反射 
导航 、 视 觉 导 航 、 味 觉 导航 、 声 音 导 航 等 。 其 中 ,视觉 导航 方式 因 具 有 信号 探测 范围 宽 、 信 
息 获取 内 容 全 等 优点 而 成 为 移动 机 器 人 导航 的 一 个 主要 发 展 方向 。 在 视觉 导航 系统 中 ， 视 觉 
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传感器 可 以 是 摄像 机 (包括 单 向 、 全 向 及 双 目 等 CCD 摄像 机 ) 、 激 光 、 雷 达 等 环境 感知 传 感 
器 ， 主 要 完成 运行 环境 中 障碍 及 特征 检测 和 特征 辨识 的 功能 。 依据 环境 间 的 描述 方式 ， 
Desouza 等 人 将 移动 机 器 人 视觉 导航 方式 划分 为 如 下 三 类 ; 

1) 基于 地 图 的 导航 (Map-Based Navigation ) : 具有 人 先 验 的 占据 栅 格 (Occupancy Grids) 、 
几何 图 元 (Geometric Primitives) 或 拓扑 特征 (Topological Features) 表示 的 环境 地 图 ， 机 器 
人 依据 这 些 先 验 的 环境 地 图 进行 导航 运动 。 

2) 基于 地 图 建立 的 导航 ( Map-Building-Based Navigation ) : 缺乏 先 验 的 环境 地 图 ， 通 过 
机 器 人 的 导航 运动 ， 利 用 本 身 装 配 的 传感器 不 断 感 知 环境 构建 地 图 ， 并 利用 已 经 建立 的 环境 
地 图 指导 机 器 人 的 导航 。 

3) 没有 地 图 的 导航 ( Mapless Navigation) : 相对 于 上 述 两 种 导航 方法 ， 没 有 任何 环境 地 
图 的 明确 表达 形式 ， 对 于 导航 ， 主 要 是 通过 传感器 获得 的 观测 信息 识别 运行 环境 中 的 物体 或 
者 跟踪 这 些 物体 来 实现 。 

4. 在 人 机 交互 中 的 应 用 

人 类 获取 外 界 信息 的 70% 是 通过 视觉 系统 获得 的 ， 因 此 计算 机 视觉 技术 是 人 机 交互 的 
核心 技术 之 一 。 

(1) 人 脸 识别 

人 脸 识 别 技术 是 指 利用 分 析 比 较 人 脸 视 觉 特征 信息 进行 身份 辨别 的 计算 机 技术 。 广 义 的 
人 脸 识 别 包 括 构建 人 脸 识 别 系统 的 一 系列 相关 技术 ， 如 人 脸 图 像 采 集 、 人 脸 定位 、 人 脸 识别 
预 处 理 、 吴 份 确认 及 身份 查询 等 。 人 脸 识别 是 一 门 热门 的 计算 机 技术 研究 领域 ， 它 属于 生物 
特征 识别 技术 。 生 物 特征 识别 技术 所 研究 的 生物 特征 包括 人 脸 、 指 纹 、 手 掌 纹 、 虹 膜 、 视 网 
膜 、 语 音 、 形 体 、 步 态 、 个 人 习惯 (如 敲 击 键 盘 的 力度 和 频率 、 签 字 ) 等 。 相 应 的 识别 技 
术 有 人 脸 识 别 、 指 纹 识别 、 掌 纹 识别 、 虹 膜 识 别 、 视 网 膜 识别 、 语 音 识 别 、 步 态 识别 等 。 人 
脸 识别 的 优势 在 于 具有 其 自然 性 和 不 被 被 测 个 体察 觉 的 特点 。 

(2) 情感 计算 

情感 计算 的 目的 是 通过 赋予 计算 机 识别 、 理 解 、 表 达 和 适应 人 的 情感 的 能 力 来 建立 和 谐 
的 人 机 环境 ， 并 使 计算 机 具有 更 高 的 、 全 面 的 智能 功能 。 

传统 的 人 机 交互 主要 通过 键盘 、 鼠 标 、 屏 幕 等 方式 进行 ， 只 追求 便利 和 准确 ， 无 法 理解 
和 适应 人 的 情绪 或 心境 的 变化 。 而 如 果 缺 乏 这 种 情感 理解 和 表达 能 力 ， 就 很 难 期 望 计算 机 具 
有 类 似 人 一 样 的 智能 ， 也 很 难 期 望 人 机 交互 做 到 真正 的 和 谐 与 自然 。 由 于 人 类 之 间 的 沟通 与 
交流 是 自然 而 富有 情感 的 ， 因 此 在 人 机 交互 的 过 程 中 ， 人 们 也 很 自然 地 期 望 计算 机 具有 情感 
能 力 。 情 感 计算 (Affective Computing) 就 是 要 赋予 计算 机 类 似 于 人 一 样 的 观察 、 理 解 和 生 
成 各 种 情感 特征 的 能 力 ， 最 终 使 计算 机 像 人 一 样 能 进行 自然 、 亲 切 和 生动 的 交互 。 
通过 计算 机 视觉 技术 获取 人 脸 表 情 ， 通 过 脸 部 表情 来 体现 情感 是 人 们 常用 的 自然 的 表现 
方式 ， 其 情感 表现 区 域 主要 包括 嘴 、 脸 颊 、 眼 睛 、 眉 毛 和 前 额 等 。 在 目前 的 人 脸 表 情 处 理 技 
术 中 ， 多 侧重 于 三 维 图 像 的 更 加 细致 的 描述 和 建 模 。 通 过 采用 复杂 的 图 形变 换算 法 ， 达 到 生 
动 的 情感 表达 效果 。 

(3) 视线 追踪 

视线 追踪 技术 是 利用 机 械 、 电 子 、 光 学 等 各 种 检测 手段 获取 受 试 者 当前 “视觉 注意 ” 
方向 的 技术 。 视 线 追 踪 分 为 穿戴 式 和 遥测 式 两 种 ， 广 泛 应 用 于 人 机 交互 、 助 残 、 虚 拟 现实 、 
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车 辆 辅助 驾驶 、 人 因 分 析 等 领域 。 其 中 ， 基 于 数字 视频 (Video Oculography，VOG) 分 析 的 
非 侵入 式 视线 追踪 技术 是 人 机 交互 领域 的 热点 研究 方向 。 其 研究 范畴 涉及 图 像 处 理 与 分 析 、 
计算 机 视觉 、 光 学 、 心 理学 和 解剖 学 等 众多 专业 领域 的 知识 。 其 技术 手段 需 融 合 头 部 位 姿 的 
检测 与 跟踪 、 人 脸 特 征 提 取 、 眼 部 特征 识别 等 多 种 生物 特征 识别 技术 ， 是 典型 的 多 学 科 、 多 
技术 交叉 的 人 机 交互 技术 。V0cG 分 析 方 法 利用 眼球 转动 时 相对 位 置 不 变 的 某 些 眼 部 结构 和 
寺 征 作为 参照 ， 在 位 置 变化 特征 和 不 变 特征 之 间 提 取 视 线 / 视 点 (Line of Sight/Point of Re- 
gard ，LOS/POR) 变化 参数 ， 然 后 通过 几何 模型 或 映射 模型 获取 视线 方向 。 因 此 ， 基 于 VOG 
分 析 的 视线 追踪 技术 分 为 视线 特征 参数 提取 和 视线 估计 模型 建立 两 个 部 分 。VOG 分 析 技 术 
普遍 采用 基于 瞳孔 中 心 -角膜 反射 方法 。 外 部 红外 光源 在 角膜 上 的 反射 点 称 为 普尔 钦 斑 。 瞳 
孔 中 心 -角膜 反射 技术 是 通过 检测 普尔 钦 斑 中 心 到 瞳孔 中 心 的 矢量 ， 利 用 眼球 成 像 模型 或 映 
射 模型 来 估计 视线 方向 的 视线 跟踪 技术 。 其 关键 技术 包括 瞳孔 及 普尔 钦 斑 分 割 及 中 心 定位 、 
瞳孔 跟踪 、 平 面 视线 参数 到 视线 方向 的 非 线性 映射 模型 建立 、 人 脸 三 维特 征 检测 、 人 脸 多 特 
征 跟踪 和 姿态 估计 等 。 

(4) 手势 动作 (手语 ) 

基于 计算 机 视觉 的 手势 交互 表达 的 意义 很 丰富 ， 具 有 很 高 的 信息 量 。 例 如 ， 人 通过 手 的 
不 同 手势 、 位 置 和 方向 等 可 以 组 合 出 非常 多 的 信息 ， 并 且 更 加 符合 人 们 的 思维 方式 。 并 且 手 
势 交 互 可 以 与 其 他 交互 方式 共同 组 成 一 组 信息 ， 从 而 得 到 确切 的 含义 。 

利用 手 部 行为 控制 计算 机 的 可 视 化 人 机 交互 方式 主要 有 两 种 : 一 种 是 基于 手势 的 位 置信 
息 ， 即 通过 手指 指 尖 的 移动 或 点 击 来 实现 相应 的 功能 ， 达 到 代替 鼠标 或 触摸 屏 等 计算 机 外 部 
设备 的 目的 ; 另 一 种 是 基于 手势 的 姿态 信息 ， 即 利用 人 手 所 形成 的 各 种 各 样 的 复杂 手势 ， 对 
计算 机 发 出 不 同 的 控制 命令 。 迄 今 为 止 ， 这 两 种 人 机 交互 技术 表现 在 如 下 几 个 方面 的 应 用 : 
上 点 鼠标 、 手 指 书写 或 绘画 系统 、 汉 语 手 指 字母 识别 、 手 势 语言 识别 等 。 

(5) 层 读 

层 读 / 视 话 (Lip-Reading/Speech-Reading) 技术 是 指 通过 观察 说 话 者 的 口 型 变化 ，“ 读 
出 ”或 “部 分 读 出 ”其 所 说 的 内 容 。 其 目的 是 利用 视觉 信道 信息 补充 听觉 信道 信息 ， 提 高 
计算 机 系统 的 理解 力 。 层 读 技 术 源 于 听力 弱者 或 者 听力 障碍 者 学 习 、 了 解 正常 人 的 表达 的 一 
种 技巧 。 它 亦 可 用 于 特定 场合 的 信息 获取 (如 情报 获取 、 噪 声 环境 的 语音 信息 理解 等 ) 。 目 
前 ， 层 读 技术 已 经 被 广泛 应 用 于 语音 识别 、 身 份 识别 、 人 机 智能 接口 及 多 媒体 系统 等 领域 。 

实现 一 个 完整 的 层 读 系统 需要 完成 从 说 话 者 视频 信息 采集 、 层 动 检测 、 层 动 定位 与 特征 
提取 、 层 读 识 别 及 层 读 与 语音 信息 的 融合 等 多 个 复杂 的 工作 环节 。 说 话 者 视频 信息 采集 是 利 
用 摄像 机 、 摄 像 头等 视频 采集 工具 获取 说 话 者 的 视频 图 像 信息 。 层 动 检测 是 从 给 定 的 图 像 或 
视频 中 找到 人 脸 、 嘴 和 所 关心 的 层 部 区 域 。 层 动 定位 与 特征 提取 是 研究 如 何 从 序列 图 像 中 定 
位 层 、 提 取 适 合 层 读 的 有 效 特 征 对 层 部 进行 描述 。 层 读 识别 是 采用 适当 方法 对 提取 的 特征 量 
进行 层 部 动作 的 识别 。 层 读 与 语音 信息 的 融合 是 采用 一 定 的 信息 融合 手段 将 语音 和 层 读 两 个 
信道 进行 融合 。 

(6) 步 态 识别 

步 态 识别 是 通过 分 析 人 行走 时 的 方式 对 人 的 身份 进行 鉴别 的 ， 具有 非 侵 犯 性 和 可 接收 性 
高 的 特点 ， 最 易于 秘密 地 远 距 离 捕获 信息 ， 因 此 受到 了 研究 者 的 广泛 关注 。 步 态 是 一 种 复杂 
的 行为 特征 ， 步 态 识别 的 输入 是 一 段 行走 的 视频 图 像 序 列 ， 由 于 序列 图 像 的 数据 量 较 大 ， 因 
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此 步 态 识别 的 计算 复杂 性 比较 高 ， 处 理 起 来 也 比较 困难 。 此 外 ， 人 体 步 态 受 地 面 状态 、 行 走 
速度 、 精 神 状态 、 穿 着 等 的 影响 比较 大 ， 因 此 也 使 得 步 态 识别 成 为 一 个 非常 具有 挑战 性 的 课 
题 。 

5. 在 虚拟 现实 中 的 应 用 

计算 机 视觉 技术 在 虚拟 现实 技术 中 的 一 个 典型 应 用 是 增强 式 虚 拟 现实 系统 。 增 强 式 虚拟 
现实 系统 中 既 可 以 允许 用 户 看 到 真实 世界 ， 同 时 也 可 以 看 到 三 加 在 真实 世界 上 的 虚拟 对 象 。 
它 是 把 真实 环境 和 虚拟 环境 组 合 在 一 起 的 一 种 系统 ， 既 可 以 减少 构成 复杂 真实 环境 的 计算 
(因为 部 分 环境 由 真实 环境 代 蔡 ) ， 又 可 以 对 实际 物体 进行 操作 ( 因为 部 分 物体 是 真实 环 
境 ) ， 真 正 达 到 了 亦 真 亦 幻 、 虚 实 融合 的 境界 。 在 增强 式 虚 拟 现实 系统 中 ， 虚 拟 对 象 所 提供 
的 信息 往往 是 用 户 无 法 凭借 其 自身 感觉 器 官 直 接 感知 的 深层 信息 ， 用 户 可 以 利用 虚拟 对 象 所 
提供 的 信息 来 加 强 现实 世界 中 的 认 知 。 在 增强 式 虚 拟 现实 系统 中 ， 真 实 环 境 的 获取 、 真 实 环 
境 与 虚拟 环境 的 配 准 、 视 频 的 合成 与 显示 等 都 离 不 开 计算 机 视觉 技术 。 

增强 式 虚 拟 现实 系统 被 广泛 应 用 于 多 个 领域 ， 如 尖端 武器 、 飞 行 需 的 研制 与 开发 ， 数 据 
模型 的 可 视 化 ， 虚 拟 训练 ， 娱 乐 与 艺术 等 。 同 时 ， 由 于 其 具有 了 能够 对 真实 环境 进行 增强 显示 
输出 的 特性 ， 在 医疗 研究 与 解剖 训练 、 精 密 仪 器 制造 和 维修 、 军 用 飞机 导航 、 工 程 设计 和 远 
程 机 咒 人 控制 等 方面 的 应 用 也 越 来 越 多 。 以 下 简 述 几 个 主要 应 用 领域 。 

1) 军事 领域 ”部队 可 以 利用 增强 式 虚 拟 现实 技术 ， 进 行 方位 的 识别 ， 获 得 目前 所 在 地 
点 的 地 理 数 据 等 重要 军事 数据 。 例 如 ， 战 斗 机 驾驶 员 使 用 的 头盔 可 让 鸭 驶 员 同 时 看 到 外 面世 
界 及 头盔 上 面 的 合成 图 形 。 人 额外 的 图 形 可 在 驾驶 员 对 机 外 地 形 视图 上 闭 加 地 形 数据 等 重要 军 
事 数据 。 

2) 飞行 模拟 训练 ”在 飞行 模拟 如 和 飞行 员 的 模拟 培训 中 ， 飞 行 员 戴 上 头盔 后 可 以 看 见 
自己 的 腿 、 手 、 机 舱 ， 但 是 外 面 的 机 场 、 跑 道 、 天 空 都 是 硬 加 上 去 的 ， 可 以 保证 飞行 员 在 很 
真实 的 环境 中 进行 飞行 训练 。 

3) 在 古迹 复原 和 数字 化 文化 遗产 保护 方面 文化 古迹 的 信息 以 增强 式 虚拟 现实 的 方式 
提供 给 参观 者 ， 用 户 不 仅 可 以 通过 头盔 显示 需 看 到 古迹 的 文字 解说 ， 还 能 看 到 遗址 上 残缺 部 
分 的 虚拟 重 构 。 

4) 工业 维修 领域 通过 头盔 显示 器 将 多 种 辅助 信息 显示 给 用 户 ， 包 括 虚 拟 仪 表 的 面 
板 、 被 维修 设备 的 内 部 结构 、 被 维修 设备 零件 图 等 。 例 如 ，20 世纪 90 年 代 初期 ， 美 国 波音 
公司 的 Tom Canden 和 他 的 同事 设计 了 一 个 辅助 布线 系统 。 该 系统 应 用 S$ - HMD 把 简单 线条 
绘制 的 布线 路 径 和 文字 提示 信息 实时 地 释 加 在 机 械 师 的 视野 中 ， 而 这 些 信息 可 以 帮助 机 械 师 
一 步 一 步 地 完成 一 个 拆卸 过 程 ， 减 少 日 常 工作 中 出 错 的 机 会 。 

5) 市 政 建设 规划 ”采用 增强 式 虚 拟 现实 技术 将 规划 效果 着 加 到 真实 场景 中 直接 获得 规 
划 效 果 。 

6) 电视 转播 领域 通过 增强 式 虚 拟 现实 技术 可 以 在 转播 体育 比赛 的 时 候 实 时 地 将 辅助 
信息 县 加 到 画面 中 ， 使 观众 可 以 得 到 更 多 信息 。 

7) 网 络 视频 通信 领域 该 领域 的 系统 使 用 增强 式 虚 拟 现实 和 人 脸 跟 踪 技 术 。 通 话 的 同 
时 ， 在 通话 者 的 面部 实时 闭 加 一 些 如 帽子 、 眼 镜 等 虚拟 物体 ， 在 很 大 程度 上 提高 了 视频 对 话 
的 趣味 性 。 

6. 在 卫星 未 感 中 的 应 用 
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卫星 遥感 图 像 信 息 量 大 ， 数 据 存在 多 种 干扰 和 误差 ,处 理 和 分 析 的 工作 量 、 难 度 都 很 
大 。 计 算 机 视觉 搁 术 可 用 于 分 析 各 种 匠 感 图 像 ， 进 行 环境 检测 、 地 理 测量 ,根据 地 形 、 地 貌 
的 图 像 和 图 形 特征 对 地 面目 标 进行 自动 识别 、 理 解 和 分 类 。 

7. 在 公安 与 安防 系统 中 的 应 用 

在 视频 监控 系统 中 ， 计 算 机 视觉 技术 在 用 于 增强 岁 像 质量 、 捕 捉 突 发 事件 、 监 控 复 杂 场 
景 、 鉴 别 身份 和 跟踪 可 疑 目标 等 方面 ， 能 大 幅度 提高 监控 效率 ， 减 小 危险 事件 发 生 的 概 
率 。 

计算 机 人 像 组 合 技术 可 以 根据 目击 者 的 描述 ， 由 计算 机 用 不 同 的 人 面部 图 像 部 件 组 合 出 
嫌疑 人 的 人 面部 图 像 协助 破案 。 在 公安 刑侦 中 ， 它 还 应 用 了 模糊 图 像 复 原 技 术 对 犯罪 现场 的 
模糊 图 像 进行 复原 处 理 。 

此 外 ,计算机 视觉 已 经 用 于 各 种 运动 分 析 、 人 体 测量 、 食 品 、 心 理学 、 电 视 电 影 、 美 术 
模型 、 远 程 教育 、 多 媒体 教学 等 场合 。 









































1.2 计算 机 视觉 检测 技术 


1.2.1 计算 机 视觉 检测 技术 分 类 


计算 机 视觉 检测 技术 是 计算 机 视觉 在 检测 领域 的 应 用 ， 即 用 计算 机 代替 人 有 眼 实现 “ 测 
量 与 判断 ”， 实 现 生产 、 生 活 中 的 “ 检 ” 与 “ 测 ” 任 务 。 视 觉 检测 中 的 “ 检 ” 主 要 是 用 计 
算 机 视觉 技术 来 检查 或 识别 出 感 兴趣 的 东西 ， 如 集成 电路 中 的 焊 点 缺陷 识别 、 印 刷 套色 识 
别 、 汽 车 牌照 识别 等 。 视 觉 检测 中 的 “ 测 ” 则 主要 是 用 计算 机 视觉 技术 来 实现 几何 量 或 者 
某 种 物理 量 的 测量 ， 即 通常 所 说 的 图 像 测量 或 视觉 测量 。 由 此 可 见 ， 视 觉 检测 的 内 容 不 仅 包 
含 计算 机 视觉 中 的 一 般 内 容 ， 如 视觉 感知 、 图 像 处 理 与 分 析 及 模式 识别 等 ， 同 时 也 有 测量 领 
域 的 特殊 性 ， 如 空间 几何 尺寸 的 精确 检测 和 定位 。 

综 上 所 述 ， 计 算 机 视觉 检测 技术 按 检测 性 质 和 应 用 范围 可 以 划分 为 定性 检测 和 定量 检测 
两 类 系统 如 图 1. 6 所 示 。 定 性 检测 主要 用 于 识别 (字符 、 标 签 识 别 )、 分 类 (原材料 、 零 部 
件 、 成 品 分 类 等 ) 、 质 量 〈 表 面 质量 、 零 部 件 缺 失 ) 和 安全 控制 (上 自动 机 构 的 运动 范围 、 视 
觉 控 制 机 器 人 的 运动 轨迹 等 ) 等 方面 。 定 量 检 测 主 要 用 于 产品 尺寸 及 形 位 误差 的 检测 。 定 
量 的 视觉 检测 又 称 为 视觉 测量 。 

由 于 计算 机 视觉 检测 技术 具有 自动 化 、 非 接触 和 高 精度 等 特点 ， 因 此 已 经 成 为 仪器 科学 
中 迅速 发 展 的 重要 领域 之 一 ， 并 在 汽车 、 制 药 、 电 子 与 电气 、 制 造 、 食 品 饮料 、 印 刷 包 装 及 
医学 等 领域 得 到 广泛 应 用 。 其 典型 应 用 有 汽车 零 配件 太 寸 和 自动 装配 完整 性 检查 、 医 药 胶 赛 
壁 厚 和 外 观 缺 陷 检 查 、 电 子 装 配 线 的 元 咒 件 上 自动 定位 、 轴 承 滚 珠 的 数量 及 破损 情况 检查 、 饮 
料 瓶 盖 的 印刷 质量 检查 、 饮 料 行业 的 容 带 质量 检测 、 饮 料 充 灌 检 测 、 产 品 包 装 上 的 条 码 和 字 
符 识别 、 钢 板 表 面 的 自动 探伤 、 机 械 零 件 的 自动 识别 分 类 和 几何 尺寸 测量 、 医 学 图 像 分 析 
等 。 此 外 ， 在 许多 常规 方法 难以 检测 的 场合 ， 如 微小 尺寸 的 精确 快速 测量 、 形 状 匹配 、 颜 色 
辨识 等 ， 用 人 了 眼 根 本 无 法 连续 稳定 地 进行 检测 ， 其 他 物理 量 传 感 带 也 难以 解决 ， 而 利用 计算 
机 视觉 检测 系统 却 可 以 有 效 地 实现 。 计 算 机 视觉 检测 系统 的 应 用 示意 图 如 图 1.6 所 示 。 
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计算 机 视觉 检测 系统 
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1.6 计算 机 视觉 检测 系统 的 应 用 示意 图 
1.2.2 计算 机 视 党 测量 技术 


从 计算 机 视觉 的 概念 和 方法 出 发 ， 将 计算 机 视觉 应 用 于 空间 几何 尺寸 的 精确 测量 和 定 
位 ， 从 而 产生 了 一 种 新 的 计算 机 视觉 应 用 概念 一 一 计算 机 视觉 测量 ( Vision Measurement ) 。 
计算 机 视觉 测量 技术 以 图 像 传感器 为 手段 检测 空间 物体 的 空间 三 维 坐标 ， 进 而 检测 物体 的 尺 
寸 、 形 状 和 运动 状态 等 。 

视觉 测量 的 分 类 方法 有 很 多 种 。 根 据 测 量 对 象 的 尺寸 大 小 ， 可 以 将 测量 系统 分 为 近景 测 
量 系统 与 显 微 测量 系统 。 其 中 ， 近 景 测量 系统 测量 的 对 象 尺 寸 是 几 十 厘米 到 几 十 米 ， 而 显 微 
测量 系统 多 指 对 片 米 数量 级 以 下 尺寸 ， 利用 各 种 放大 镜 和 显微镜 进行 的 测量 。 

根据 测量 过 程 中 系统 移动 与 否 ， 可 以 将 视觉 测量 系统 分 为 固定 式 和 移动 式 两 类 。 固 定式 
视觉 测量 系统 是 将 一 个 或 多 个 传感器 固定 安装 在 刚性 框架 上 ， 形 成 一 个 测量 视 场 ， 对 定位 在 
视 场 的 被 测 目 标 进行 测量 。 该 方法 主要 用 于 高 精度 的 快速 检测 。 移 动 式 视 觉 测量 系统 是 使 传 
感 带 沿 着 指定 的 轨迹 移动 来 实现 对 被 测 目 标的 测量 。 该 方法 一 般 用 于 一 些 特殊 应 用 场合 

按照 测量 过 程 的 照明 方式 ， 可 以 将 视觉 测量 系统 分 为 主动 式 视觉 测量 量 系统 与 被 动 式 视觉 
测量 系统 。 主 动 式 视觉 测量 是 利用 特殊 的 受 探 光源 ( 称 为 主动 光源 ) 照射 被 测 景物 ， 根 据 
主动 光源 的 已 知 结构 信息 (几何 的 、 物 理 的 或 光学 的 信息 ) 获取 景物 的 三 维 信息 。 在 主动 
式 视 觉 测 量 中 ， 景 物 中 的 深度 信息 由 三 点 (光源 点 、 景 物 中 心 的 照明 点 和 图 像 中 的 点 ) 所 
确定 ， 具 有 测 距 精 度 高 ， 抗 干扰 性 能 好 和 实时 性 强 等 特点 。 被 动 式 视觉 测量 技术 不 需要 特殊 
光源 ， 完 成 测量 用 的 照明 是 由 物体 周围 的 光线 来 提供 的 ， 常 常 是 自然 光 。 由 于 被 动 式 视觉 测 
量 不 需要 设置 受 控 的 主动 光源 ， (0 且 与 人 眼 的 视觉 习惯 比较 接近 ， 因 而 在 
计算 机 视觉 测量 中 得 到 了 广泛 应 
运动 ， 可 以 将 视觉 测量 系统 分 为 静态 图 像 视觉 测量 系统 和 
动态 图 视觉 测量 系统 。 静 态 图 像 包 括 静 止 图 像 和 凝固 图 像 。 静 止 图 像 是 指 每 幅 图 像 都 是 一 幅 
静止 图 像 。 凝 固 图 像 是 指 动态 图 像 中 的 某 一 帧 图 像 。 动 态 图 像 以 帧 率 度量 ， 帧 率 反 映 了 画面 
中 运动 的 连续 性 。 

根据 测量 系统 使 用 的 摄像 机 数量 的 不 同 ， 视 觉 测 量 系统 可 以 分 为 单 目 视 觉 测 量 系 统 、 双 
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18 
目 视 觉 测量 系统 和 多 目 视觉 测量 系统 等 。 单 目 视觉 测量 系统 采用 一 人 台 摄 像 机 对 目标 进行 测 
量 ， 常 见于 平面 测量 系统 。 单 目测 量 系统 中 ， 摄 像 机 的 内 参数 一 般 不 需要 标定 ， 使 用 比较 简 
单 ， 但 是 单 目 视觉 测量 系统 对 深度 信息 的 恢复 能 力 较 弱 。 双 目 视觉 测量 系统 使 用 两 台 摄像 机 
对 目标 进行 测量 ， 是 最 为 常见 的 一 类 测量 系统 。 双 目 视觉 系统 在 测量 目标 的 三 维 信息 时 ， 需 
要 对 两 台 摄像 机 的 内 参数 和 外 参数 进行 标定 。 双 目测 量 系统 恢复 三 维 信息 的 能 力 强 ， 但 其 测 
量 精度 与 摄像 机 的 标定 精度 密切 相关 。 多 目 视 觉 测量 系统 采用 多 台 摄 像 机 对 目标 进行 测量 ， 
多 见于 三 维 重 构 和 运动 测量 及 较 大 尺寸 物体 的 几何 量 测量 。 

视觉 测量 作为 当今 高 新 技术 之 一 ， 在 电子 技术 、 光 电 探 测 技术 、 图 像 处 理 与 分 析 技 术 、 
计算 机 技术 、 人 工 智能 技术 不 断 成 熟 和 完善 的 基础 上 ， 得 到 了 突飞猛进 的 发 展 ， 并 有 着 广泛 
的 应 用 。 多 年 来 发 达 国 家 竞相 开展 这 项 高 新 技术 。 例 如 ， 应 用 于 产品 的 在 线 质量 监控 、 微 电 
子 部 件 (IC、PCB、BGA) 自动 检测 、 各 种 模具 三 维 形状 的 测量 及 生产 线 中 机 械 手 的 定位 与 
瞄准 ， 由 多 个 视觉 传感器 组 建 的 柔性 的 空间 三 坐标 测量 站 〈 多 传感器 视觉 测量 系统 ) 来 完 
成 对 大 型 物体 的 三 维 空间 尺寸 的 全 自动 实时 测量 。 

美国 、 加 拿 大 、 日 本 等 发 达 国 家 早 在 20 世纪 60 年 代 后 期 就 已 经 开始 了 计算 机 视觉 测量 
技术 的 研究 。 直 到 20 世纪 90 年 代 ， 随 着 计算 机 技术 的 发 展 成 熟 ， 计 算 机 视觉 测量 技术 逐渐 
成 为 一 个 研究 热点 。 同 发 达 国 家 相 比 ， 我 国 的 计算 机 视觉 测量 研究 从 20 世纪 90 年 代 才 开始 
得 到 重视 ,经 过 近 20 年 的 发 展 ， 目 前 在 计算 机 视觉 测量 技术 的 理论 模型 、 实 验 验证 、 实 用 
系统 建立 与 改进 完善 等 研究 方面 ， 已 取得 了 许多 令 人 满意 的 成 果 。 但 是 总 体 研 究 水 平 相 对 落 
后 ， 主 要 表现 在 测量 功能 比较 单一 、 自 动 化 与 智能 化 程度 不 高 及 缺乏 高 水 平 的 实用 产品 等 方 
面 。 


1.2.3 计算 机 视觉 测量 系统 构成 


计算 机 视觉 测量 系统 是 计算 机 视觉 技术 在 测量 领域 中 的 延伸 ， 因 此 两 者 的 结构 基本 相 
同 。 与 普通 的 视觉 系统 相 比 ， 视 觉 测量 系统 对 照明 光源 、 成 像 系统 及 图 像 处 理 有 着 更 高 的 要 
求 。 在 实际 应 用 中 ， 为 了 达到 更 高 的 测量 精度 ， 一 般 都 附加 视觉 反馈 系统 。 网 络 化 已 经 成 为 
一 种 趋势 ， 在 现代 化 的 制造 业 、 军 事 、 航 空 航天 等 应 用 领域 ， 网 络 化 的 测量 系统 已 经 逐步 得 
到 应 用 。 因 此 典型 视觉 测量 系统 的 结构 如 图 1.7 所 示 ， 其 基本 工作 流程 可 以 描述 为 ， 光 学 系 
统 将 被 测 目 标 成 像 在 CCD 摄像 机 的 光敏 面 上 ; CCD 摄像 机 的 光敏 单元 将 被 测 目 标 图 像 转换 
为 电信 号 ; 通过 A-D 转换 器 ， 图 像 采集 卡 将 模拟 电信 和 号 转换 为 数字 图 像 信 号 ， 并 将 其 输入 
到 计算 机 ; 计算 机 利用 图 像 处 理 技术 对 获取 的 图 像 进 行 各 种 变换 和 操作 ， 对 图 像 中 感 兴趣 的 
目标 进行 测量 ， 从 而 获得 图 像 特征 物 的 特征 参数 ， 提 供 分 析 和 反馈 控制 ， 最 后 根据 预 设 的 容 
许 度 和 其 他 条 件 输出 结果 。 对 于 那些 网 络 化 的 应 用 ， 被 测 物体 的 图 像 可 以 通过 各 种 传输 介质 
传输 到 计算 机 处 理 系 统 。 

1. 光源 

光源 是 影响 视觉 测量 系统 输入 的 重要 因素 。 这 是 因为 它 直接 影响 输入 数据 的 质量 和 应 用 
效果 。 由 于 没有 通用 的 视觉 测量 系统 照明 设备 ， 所 以 针对 每 个 特定 的 应 用 实例 ， 要 选择 相应 
的 照明 装置 ， 以 达到 最 佳 效果 。 

许多 工业 用 的 视觉 测量 系统 用 可 见 光 作 为 光源 ， 这 主要 因为 可 见 光 容易 获得 、 价 格 低 ， 
并 且 便于 操作 。 和 常用 的 几 种 可 见 光 源 是 白炽 灯 、 殉 光 灯 、 条 灯 和 钠灯 。 但 是 ， 这 些 光 源 的 一 
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个 最 大 缺点 是 光量 不 能 保持 稳定 ， 随 着 使 用 时 间 的 增加 ， 光 量 将 不 断 下 降 。 因 此 如 何 使 光量 
在 一 定 程度 上 保持 稳定 ， 是 实用 化 过 程 中 需要 解决 的 问题 。 男 一 个 方面 ， 环 境 光 将 改变 这 些 
光源 照射 到 物体 上 的 总 光量 ， 使 输出 的 图 像 数 据 存在 噪声 ， 一 般 采 用 加 防护 屏 的 方法 减少 环 
境 光 的 影响 。 由 于 存在 上 述 问 题 ， 在 现今 的 工业 应 用 中 ， 对 于 某 些 要 求 高 的 测量 任务 常 采用 
X 射线 、 超 声波 等 不 可 见 光 作为 光源 。 

由 光源 构成 的 照明 系统 按 其 照射 方法 可 分 为 透射 式 照 明 、 反 射 式 照明 、 结 构 光 照明 和 频 
闪光 照明 等 。 其 中 ， 透 射 式 照明 是 把 被 测 物 放 在 光源 和 摄像 机 之 间 ， 采 用 背光 源 照 明 ， 其 目 
的 在 于 提高 目标 与 背景 的 对 比 度 。 它 的 优点 是 能 获得 高 对 比 度 的 图 像 反 射 式 照明 是 光源 和 摄 
像 机 位 于 被 测 物 的 同 侧 ， 使 被 测 物 的 照度 均匀 分 布 ， 这 种 方式 便于 安装 结构 光照 明 是 将 光栅 
或 线 光 源 等 一 定 类 型 的 结构 光 投 射 到 被 测 物 上 ， 根 据 它 们 在 物体 上 产生 的 畸变 ， 解 调 出 被 测 
物 的 三 维 信息 频 闪光 照明 是 将 高 频率 的 光 脉 冲 照射 到 物体 上 ， 要 求 摄像 机 的 扫描 速度 与 光源 
的 频 内 速度 同步 。 






































图 1.7 典型 视觉 测量 系统 的 结构 





2. 图 像 处 理 系统 

图 像 处理 系 统 是 整个 计算 机 视觉 测量 系统 的 关键 ， 其 处 理 精度 直接 影响 着 整个 视觉 测量 
装置 的 精度 。 处 理 器 运用 不 同 的 算法 来 提高 对 测量 精度 有 重要 影响 的 图 像 特性 。 处 理 器 提取 
图 像 特性 ， 测 量 被 测 目标 的 几何 参数 或 频谱 参数 。 例 如 ， 集 成 电路 制造 中 对 BGA 引 脚 高 度 
的 检测 。 视 觉 测 量 系统 中 ， 信 息 的 处 理 技术 主 要 依赖 于 图 像 处 理 方法 ， 包 括 图 像 滤波 、 图 像 
增强 、 图 像 分 割 、 图 像 特征 抽取 、 图 像 识 别 与 理解 等 内 容 。 

从 组 建 计算 机 视觉 测量 系统 的 时 间 周 期 看 ， 图 像 处 理 软件 的 总 体 开发 过 程 会 占据 整个 开 
发 时 间 的 1Z2 以 上 ， 由 此 可 见 图 像 处 理 系 统 所 需 投 入 的 开发 成 本 之 大 。 算 法 是 软件 的 灵魂 ， 
决定 着 软件 的 可 靠 性 、 运 算 速 度 、 安 全 性 和 和 鲁 棒 性 等 重要 指标 ， 这 些 指 标 左右 着 图 像 处 理 系 
统 的 成 败 。 因 此 ， 如 何在 具体 的 应 用 中 采用 更 好 的 算法 以 最 大 限度 地 降低 计算 结果 与 理想 对 
象 的 误差 ， 是 图 像 处 理 系统 研究 的 重要 课题 ， 并 决定 着 计算 机 视觉 测量 系统 的 发 展 方向 。 

3. 视觉 反馈 控制 系统 

视觉 反馈 控制 系统 的 基本 功能 是 根据 测量 任务 的 需要 ， 实 现 照明 系统 的 光 场 调节 和 摄像 
机 的 位 置 、 视 角 、 焦 距 等 参数 的 调节 控制 。 按 部 件 功 能 划分 ， 可 分 为 控制 器 单元 和 执行 机 构 
单元 两 部 分 。 控 制 器 单元 是 整个 反馈 控制 系统 的 核心 。 它 通过 对 系统 各 状态 变量 的 观测 做 出 
判断 ， 进 而 为 执行 机 构 单 元 发 出 各 种 指令 ， 以 满足 测量 任务 的 需求 。 

设计 计算 机 视觉 测量 系统 时 应 遵循 以 下 设计 原则 : 中 保证 充分 的 视 场 ; @ 足 够 的 图 像 分 
辩 率 ; @ 清 晰 的 图 像 对 比 度 ; 由 尽量 缩短 图 像 获 取 时 间 ; 名 使 系统 工作 稳定 、 抗 干 捧 、 低 成 
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本 。 此 外 ， 还 要 综合 考虑 视 场 范围 、 分 辨 率 的 大 小 ， 以 及 景深 长 短 等 因素 。 图 1. 8 所 示 为 一 
个 典型 的 视觉 测量 系统 。 
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图 1.8 典型 的 视觉 测量 系统 
1.2.4 计算 机 视觉 测量 技术 的 性 能 指标 


测量 速度 和 测量 精度 是 衡量 计算 机 视觉 测量 系统 的 两 个 重要 的 性 能 指标 。 

1. 测量 速度 

计算 机 视觉 测量 系统 大 多 用 在 工业 现场 及 工业 生产 线 中 ， 承 担 在 线 实 时 测量 任务 ， 因 此 
要 求 测量 速度 与 生产 线 节拍 一 致 ， 这 也 是 计算 机 视觉 测量 系统 走 上 实际 应 用 的 前 提 条 件 。 提 
高 计算 机 视觉 测量 系统 测量 速度 的 常用 方法 有 ， 在 不 增加 太 多 投入 的 情况 下 ， 采 用 软件 硬件 
化 ， 即 部 分 软件 的 功能 由 硬件 来 实现 ; 使 用 带 预 处 理 功 能 的 图 像 卡 ; 采用 更 高 效率 的 图 像 处 
理 算法 等 。 测 量 速 度 对 于 离线 测量 也 是 重要 指标 之 一 。 

2. 测量 精度 

精度 指标 是 测量 系统 最 基本 的 性 能 指标 ， 要 完成 对 被 测 物体 的 测量 ， 系 统 须 满足 一 定 的 
量 精度 ， 以 确保 获得 有 意义 的 数据 ， 才 能 保证 测量 结果 的 可 信 性 。 

一 般 来 说 ,摄像 机 的 视野 不 能 太 大 ， 否 则 单位 像素 的 物理 尺寸 就 会 很 大 。 增 加 成 像 系统 
的 分 辩 率 ， 可 以 提高 测量 精度 ,但 成 本 会 成 倍增 加 。 采 用 亚 像素 细 分 技术 和 系统 标定 方法 可 
以 提高 测量 精度 ， 因 此 构建 实际 的 视觉 测量 系统 需要 在 测量 速度 、 精 度 、 成 本 之 间 寻 求 一 个 
最 优 组 合 。 要 从 硬件 和 软件 两 个 方面 优化 系统 ， 以 达到 要 求 的 测量 精度 。 

除了 测量 速度 与 测量 精度 外 ， 测 量 范 围 、 自 动 化 智能 程度 、 易 维护 性 等 也 是 在 实际 应 用 
中 需要 考虑 的 因素 。 


1.2.5 计算 机 视觉 测量 系统 的 关键 技术 


视觉 测量 系统 把 图 像 当 做 测量 和 传递 信息 的 手段 或 载体 加 以 利用 ,其 目的 是 从 图 像 中 提 
取 有 用 的 信号 。 因 此 ， 如 何 准 确 得 到 目标 点 的 位 置 ， 是 视觉 测量 技术 中 的 关键 问题 之 一 。 具 
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体 来 说 ， 计 算 机 视觉 测量 系统 的 关键 技术 主要 包括 光源 照明 技术 、 图 像 处 理 与 分 析 技 术 、 摄 
像 机 标定 技术 、 三 维 测量 技术 、 图 像 拼接 技术 和 三 维 重 构 技 术 等 。 以 下 对 光源 照明 技术 、 图 
像 处 理 与 分 析 技 术 和 摄像 机 标定 技术 进行 简单 介绍 。 

1. 光源 照明 技术 

光源 照明 技术 的 好 坏 往往 关系 到 整个 测量 系统 的 成 败 ， 它 包括 光源 与 照明 方式 两 个 部 
分 。 光 源 直接 影响 输入 数据 的 质量 和 至 少 30% 的 应 用 效果 。 由 于 没有 通用 的 计算 机 视觉 昭 
明 设备 ， 所 以 针对 每 个 特定 的 应 用 实例 ， 要 选择 相应 的 照明 装置 ， 以 达到 最 佳 效果 。 对 于 同 
一 场景 ， 照 明光 源 的 波长 、 光 线 入 射 角度 、 发 光 强 度 的 大 小 及 照射 方式 ， 都 会 对 采集 数据 造 
影响 ， 最 终 决 定 图 像 测量 结果 。 图 像 采 集 时 ， 好 的 光源 与 照明 方案 并 不 是 简单 地 照 亮 物 
体 。 光 源 与 照明 方案 的 配合 应 尽 可 能 地 突出 物体 特征 量 ， 使 物体 需要 测量 的 目标 与 其 他 部 分 
之 间 尽 可 能 地 产生 明显 的 区 别 ， 增 加 对 比 度 。 同 时 ， 还 应 保证 足够 的 整体 亮度 ， 使 物体 位 置 
的 变化 不 影响 成 像 的 质量 。 光 源 的 选择 必须 符合 所 需 的 几何 形状 ， 照 明 的 亮度 与 均匀 度 、 发 
光 的 光 特性 也 必须 符合 实际 要 求 ， 同 时 还 要 考虑 光源 的 光 视 效能 (俗称 发 光 效 率 ) 和 使 用 
寿命 。 应 根据 实际 任务 ， 选 择 和 设计 不 同 的 光源 形式 。 

总 而 言 之 ， 好 的 光源 照明 系统 能 够 改善 整个 系统 的 分 辨 率 ， 简 化 整个 软件 的 计算 。 不 合 
适 的 照明 则 会 引起 很 多 问题 。 例 如 ， 花 点 会 隐藏 很 多 重要 信息 ， 阴 影 会 引起 边缘 的 误 测 。 信 
品 比 的 降低 及 不 均匀 会 增加 图 像 处 理 的 难度 等 。 由 此 可 见 ， 必 须 选用 合适 的 照明 装置 。 照 明 
装置 产生 的 效果 随 测 量 对 象 、 测 量 目的 、 测 量 环境 的 不 同 而 不 同 ， 应 通过 实验 来 确定 。 

2. 图 像 处 理 与 分 析 技 术 

个 人 计算 机 、 视 频 洲 戏 、 手 机 是 目前 推动 图 像 处 理 器 向 前 发 展 的 主要 因素 。 而 图 像 处 理 
器 的 发 展 也 为 工业 图 像 测量 系统 带 来 了 新 的 机 会 和 技术 问题 解决 方案 。 特 别 是 在 处 理 大 量 数 
据 的 实时 性 方面 ， 新 的 图 像 处 理 器 为 准确 实时 地 处 理 大量 的 图 像 数据 提供 了 稳定 可 靠 的 平台 
和 可 能 性 。 特 别 是 舰 入 式 系 统 的 快速 发 展 ，DSP 技术 的 不 断 提 升 ， 新 的 专用 图 像 处 理 器 的 不 
断 出 现 ， 使 得 实时 处 理 能 力 得 到 了 质 的 飞跃 。 很 多 专用 的 图 像 处 理 与 分 析 算 法 可 以 应 用 FP- 
GA 器 件 通过 人 硬件 来 直接 实现 ， 这 也 使 工业 图 像 测量 系统 处 理 速度 越 来 越 快 ， 实 时 性 越 来 越 
好 ， 应 用 领域 不 断 扩展 。 图 像 分 析 与 处 理 方 法 是 保证 测量 精度 和 实时 性 的 关键 。 

图 像 处 理 与 分 析 技 术 包 括 图 像 预 处 理 、 图 像 分 割 与 特征 提取 及 立体 图 像 匹 配 、 图 像 拼接 
等 几 个 部 分 。 图 像 预 处 理 主要 包括 图 像 灰 度 变 换 、 图 像 去 噪 和 图 像 增强 。 图 像 特 征 提 取得 到 
匹配 所 需 的 特征 点 和 边缘 。 图 像 特 征 提取 的 具体 形式 与 匹配 策略 紧密 相连 。 由 于 目前 还 没有 
一 种 普遍 使 用 的 图 像 特征 检测 理论 ， 导 致 了 立体 视觉 研究 中 图 像 匹 配 特征 的 多 样 性 。 在 立体 
视觉 研究 中 ， 图 像 特 征 提取 的 过 程 就 是 提取 图 像 匹配 基 元 的 过 程 。 由 于 图 像 对 中 不 可 避免 地 
存在 光度 学 和 几何 学 畸变 ， 所 以 选择 图 像 匹 配 基 元 时 要 考虑 基 元 的 稳定 性 和 敏感 性 。 用 于 图 
像 匹 配 的 基 元 以 图 像 特 征 为 主 ， 但 还 必须 辅 以 在 图 像 点 周围 的 区 域 上 抽取 的 测量 信息 。 当 空 
间 三 维 场 景 被 投影 为 二 维 图 像 时 ， 同 一 个 景物 在 不 同 视点 下 的 图 像 会 有 很 大 的 不 同 。 而 且 场 
景 中 的 诸多 因素 ， 如 光照 条 件 、 景 物 几何 形状 和 物理 特性 、 噪 声 干 扰 和 畸变 等 ， 都 会 被 综合 
成 单一 图 像 中 的 灰 度 值 。 对 于 任何 一 种 立体 图 像 匹 配方 法 ， 其 有 效 性 依赖 于 三 个 问题 的 解 
决 ， 即 选择 正确 的 匹配 特征 ， 寻 找 特 征 间 的 本 质 属性 及 建立 能 正确 匹配 所 选 特征 的 稳定 算 
法 。 

3. 摄像 机 标定 技术 





























































































































































































































22 


摄像 机 是 计算 机 视觉 测量 系统 中 的 一 个 关键 组 件 ， 其 本 质 功 能 就 是 将 光 信 号 转变 成 为 有 
序 的 电信 号。 摄像 机 标定 是 计算 机 视觉 系统 准确 获取 图 像 信息 的 前 提 和 基础 ， 是 计算 机 视觉 
测量 中 需要 解决 的 首要 问题 。 摄 像 机 标定 是 为 了 确定 摄像 机 的 位 置 ， 属 性 参数 和 建立 成 像 模 
型 ， 以 便 确定 空间 坐标 系 中 物体 点 同 它 在 图 像 平面 上 像 点 之 间 的 对 应 关系 。 

摄像 机 标定 就 是 计算 摄像 机 的 外 部 参数 和 内 部 参数 。 摄 像 机 的 外 部 参数 表示 摄像 机 的 位 
置 和 方位 相对 于 一 个 世界 坐标 系 的 坐标 ;内 部 参数 表示 摄像 机 的 光学 本 质 特性 ， 包 括 图 像 中 
心 点 坐标 ， 有 效 焦距 长 度 和 透镜 的 畸变 失真 系数 。 目 前 ， 常 用 的 摄像 机 标定 算法 不 需要 特别 
的 实验 装置 ， 其 中 大 部 分 方法 都 是 利用 成 像 几何 性 质 将 需要 标定 的 各 个 参数 分 解 ， 然 后 分 别 
进行 计算 。 

1.2.6 计算 机 视觉 测量 技术 的 优点 


与 传统 的 测量 方法 相 比 ， 计 算 机 视觉 测量 技术 有 如 下 几 个 方面 的 优点 : 

1) 它 是 一 种 瞬间 获取 被 测 物体 大 量 物理 信息 和 几何 信息 的 测量 手段 。 作 为 信息 载体 的 
图 片 或 影像 容纳 有 被 测 目标 的 大 量 信息 ， 特 别 适合 于 测量 点 众多 的 目标 。 

2) 它 是 一 种 非 接触 性 的 测量 手段 ， 不 伤 及 测量 目标 ， 不 干扰 被 测 物 自然 状态 ， 可 在 恶 
劣 条 件 下 应 用 。 

3) 它 是 一 种 适用 于 微观 世界 、 近 景 目标 及 较 远 目标 的 测量 技术 。 

4) 它 是 一 种 适合 于 动态 物体 外 形 和 运动 状态 测量 的 技术 。 

5) 它 是 一 种 基于 严谨 的 理论 和 现代 软 硬 件 ， 可 提供 相当 高 精度 和 可 靠 性 的 测量 手段 。 

6) 它 是 一 种 基于 数字 信息 和 数字 摄影 技术 的 测量 手段 ,计算机 视觉 测量 技术 广泛 地 应 
用 于 工业 生产 流程 中 ， 成 为 工业 产品 分 类 、 导 向 、 监 测 、 装 配 和 自动 化 生产 的 重要 组 成 部 


分 。 
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7) 它 可 提供 基于 三 维 空间 坐标 的 各 种 信息 ， 包 括 各 类 数据 、 图 形 、 图 像 、 数 字 表 面 模 
型 及 三 维 动态 序列 影像 。 


1.2.7 影响 测量 系统 精度 的 因素 与 提高 方法 


1. 影响 测量 系统 精度 的 因素 

(1) 硬件 系统 的 误差 

测量 系统 精度 主要 取决 于 摄像 机 的 物 面 分 辨 率 ， 即 一 个 像素 所 代表 的 空间 物 面 尺寸 大 
小 。 使 用 的 CCD 摄像 机 分 辩 率 越 高 、 被 测 目 标 物 的 实际 尺寸 越 小 ， 图 像 的 物 面 分 辨 率 就 越 
高 ， 即 可 使 得 系统 测量 精度 越 高 。 

成 像 系统 的 几何 畸变 误差 是 典型 的 系统 误差 ， 是 影响 光学 测量 精度 的 因素 之 一 。 选 用 高 
质量 的 镜头 和 进行 镜头 畸变 校正 可 提高 测量 精度 。 

(2) 标定 误差 

系统 标定 过 程 中 会 引入 误差 。 通 过 对 标准 件 在 摄像 机 视 场 内 不 同方 位 进行 多 次 采集 图 像 
进行 标定 ， 然 后 求 其 均值 作为 最 终 标 定 系 数 ， 这 样 可 以 消除 镜头 畸变 引起 的 误差 又 可 去 掉 标 
定 过 程 引入 的 随机 误差 。 

(3) 软件 算法 误差 

在 图 像 处 理 和 识别 算法 中 ， 图 像 分 割 中 的 算法 会 引起 误差 。 如 边缘 测量 引起 的 边缘 移 
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动 、 非 单 像素 都 会 引起 误差 。 病 值 分 割 中 由 于 阔 值 选取 引起 的 目标 范围 误差 都 会 在 实际 测量 
中 反映 出 来 。 亚 像素 定位 虽然 可 以 提高 算法 的 精度 ,但 算法 本 身 也 存在 误差 等 。 

2. 提高 视觉 测量 系统 精度 的 方法 

(1) 选用 高 分 辩 率 的 CCD 摄像 机 

选用 高 分 辨 率 的 CCD 摄像 机 ， 高 分 辩 率 的 CCD 摄像 机 相当 于 减 小 光敏 单元 之 间 的 间 
距 ， 增 加 图 像 取样 点 数 ， 可 提高 定位 精度 。 提 高 分 辩 率 会 导致 数据 量 增 加 ， 降 低 软 件 的 处 理 
效率 ， 影 响 测量 速度 。 

(2) 选择 采样 频率 比较 高 的 图 像 采 集 卡 

提高 采样 频率 ， 可 以 提高 测量 的 分 辨 率 。 随 着 采样 频率 的 增高 ， 计 算 量 和 存储 空间 增 
大 ， 并 且 随 着 采样 率 的 增加 ， 干 扰 也 会 增加 。 

(3) 提高 光学 成 像 系统 的 放大 倍数 

提高 光学 系统 的 放大 倍数 ， 在 一 定 范围 内 可 以 提高 测量 精度 。CCD 光敏 单元 的 大 小 是 
有 限 的 ， 当 放大 倍数 过 大 时 ， 图 像 质 量 反而 会 下 降 ， 其 至 超出 视 场 范围 ， 导 臻 精度 下 降 。 

(4) 采用 适当 的 标定 技术 

适当 的 标定 技术 ， 可 以 有 效 地 抑制 成 像 畸 变 的 影响 ， 提 高 测量 精度 。 标 定 技 术 要 适当 ， 
而 不 是 越 复 杂 越 好 ， 要 根据 系统 的 具体 情况 和 精度 要 求 ， 选 择 合适 的 标定 技术 ,复杂 的 标定 
技术 在 某 些 场合 不 适用 ， 甚 至 是 浪费 。 

(5) 采用 各 种 亚 像 素 定位 方法 

亚 像素 定位 方法 是 根据 图 像 特 征 ， 采 用 一 定 的 算法 来 实现 图 像 的 细 分 。 它 简单 、 有 效 而 
成 本 低 ， 是 使 用 软件 的 方法 提高 硬件 的 分 辩 率 。 


1.2.8 计算 机 视觉 测量 技术 的 主要 应 用 领域 


计算 机 视觉 测量 技术 在 产品 测量 检验 、 逆 向 工程 、 机 器 人 导航 等 领域 都 得 到 了 广泛 应 
用 ,其 具体 应 用 涉及 工业 、 农 业 、 林 业 、 纺 织 、 国 防 、 航 天 等 行业 ,与 人 们 的 生产 、 生 活 、 
科研 与 学 习 也 密切 相关 。 

1. 在 产品 测量 领域 的 应 用 

计算 机 视觉 技术 在 测量 领域 的 应 用 主要 表现 为 视觉 三 维 坐 标 测量 机 ， 可 以 测量 物体 的 几 
何 形状 、 位 置 、 圆 周 分 度 等 信息 。 图 1. 9 所 示 是 几 种 三 维 坐标 测量 机 实物 。 由 于 视觉 三 维 坐 
标 测量 机 具有 不 受 三 维 导轨 的 限制 、 可 以 实现 大 范围 的 坐标 测量 、 体 积 小 、 便 于 携带 、 使 用 
灵活 、 测 量 精度 高 等 有 优点 ， 因 此 非常 适合 于 航空 航天 、 船 舶 、 汽 车 制造 和 装配 领域 中 的 快 
速 现 场 测 量 。 下 面 简单 介绍 两 款 典 型 的 视觉 三 维 坐标 测量 仪 。 

(1) 医学 方面 

美国 Image Guided 公司 人 研究 出 了 一 种 能 用 作 医 疗 手术 定位 用 的 便携 式 视觉 坐标 定位 装 
置 ， 在 直径 1m 的 测量 范围 内 ,x 和 Yy 方向 上 的 分 辩 率 为 0. 13mm，z 方向 为 0.2mm。 

(2) 工业 现场 检测 

挪威 Mentronor 公司 研究 并 开发 一 种 能 适用 于 工业 现场 检测 用 的 便携 式 坐 标 测 量 系 统 ， 
空间 精度 为 (0. 05 + L5000) mm。 其 中 , 工 为 实际 测量 长 度 ， 单 位 为 mm。 

2. 在 逆向 工程 领域 的 应 用 

随 着 工业 技术 的 发 展 和 人 们 生活 水 平 的 提高 ， 任 何 通 用 性 产品 在 消费 者 高 品质 的 要 求 
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图 1.9 视觉 三 维 坐标 测量 机 实物 

下 ， 功 能 的 需求 已 不 再 是 赢得 市 场 竞争 力 的 惟一 条 件 。 产 品 不 但 要 求 功能 先进 ， 其 外 观 造 型 
也 必须 能 吸引 消费 者 的 注意 。 于 是 在 工业 设计 中 传统 的 顺 向 工程 流程 已 不 能 满足 需要 ， 取 而 
代 之 的 是 以 三 维 尺寸 测量 方式 建立 出 用 于 自由 曲面 的 逆向 工程 (Reverse Engineering, RE)。 
道 向 工程 技术 的 流程 主要 包括 如 下 过 程 : 

1) 实测 对 现 有 产品 或 产品 模型 进行 实测 分 析 ， 并 获得 物体 的 三 维 轮廓 数据 信息 。 

2) 重 构 ”对 这 些 数据 进行 处 理 和 三 维 重 构 ， 建 立 CAD 数据 模型 。 

3) 改进 及 再 设计 工程 设计 人 员 在 CAD 模型 上 进行 改进 或 进行 再 设计 ， 接 着 将 标准 数 
据 文 件 输出 到 快速 成 型 系统 (RP) 或 直接 生成 加 工 代 码 至 数控 加 工 系统 (CNC) ， 生 成 现实 
产品 或 模具 ， 

4) 验证 、 定 型 、 投 产 ”实验 验证 、 产 品 定 型 后 投入 生产 。 道 向 工程 技术 是 缩短 产品 开 
发 周期 的 有 效 途 径 ， 特 别 是 对 于 形状 复杂 或 由 自由 曲面 组 成 的 物体 。 

逆向 工程 技术 是 一 项 多 学 科 交 叉 的 高 技术 领域 ， 关 键 技术 主要 包括 ; 

1) 实物 扫 措 技术 实物 扫 摘 技 术 主要 完成 曲面 三 维 数据 的 获取 。 

2) 点 云 数据 处 理 技术 ”主要 完成 高 密度 、 大 容量 点 云 数据 的 处 理 ， 如 数据 简化 、 滤 
波 、 特 征 提 取 等 。 

3) 图 像 拼接 技术 主要 完成 不 同位 置 的 视觉 传 感 带 获得 点 云 数据 的 拼接 。 

4) 曲面 拟 合 技术 ”通过 数学 方法 完成 曲面 的 重 构 ， 得 到 高 质量 、 高 精度 的 曲面 模型 。 

5) 实体 三 维 重 构 技 术 主要 完成 基于 空间 测量 数据 的 三 维 重 构 。 

在 产品 造型 日 益 多 元 化 的 今天 ， 道 向 工程 已 经 成 为 产品 开发 中 不 可 或 缺 的 核心 元 素 ， 被 
广泛 应 用 在 汽车 、 航 空 航天 、 模 具 等 产品 的 改 型 与 创新 设计 。 具 体 来 说 ， 逆 向 工程 的 应 用 主 
要 集中 在 以 下 几 个 方面 : 

1) 如 飞机 、 汽 车 、 摩 托 车 、 家 电 等 对 产品 外 形 的 美学 有 特别 要 求 的 领域 ， 为 方便 评价 
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其 美学 效果 ， 设 计 师 通常 都 是 通 对 木质 、 油 泥 或 黏 士 等 材料 进行 快速 且 工 作 量 很 大 的 模型 制 
作 ， 从 而 将 所 要 表达 的 意图 以 实体 的 方式 呈现 出 来 ， 而 不 是 依赖 于 高 分 辨 率 2D 屏幕 上 的 缩 
比 模型 的 物体 投 视图 的 方法 。 因 此 ， 逆 向 工程 在 此 类 产品 的 快速 开发 中 起 到 了 举足轻重 的 作 
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2) 由 于 种 种 原因 ， 人 们 经 常 要 对 已 有 的 构件 做 局 部 修改 。 在 原始 设计 没有 三 维 产品 数 
字 化 模型 的 情况 下 ， 知 能 将 实物 零件 通过 数据 测量 与 处 理 产 生 与 实际 相符 的 产品 数字 化 模 
型 ， 对 模型 进行 修改 以 后 再 进行 加 工 ， 将 显著 提高 生产 效率 。 因 此 ， 逆 向 工程 在 改 型 设计 方 
面 也 起 着 不 可 替代 的 作用 。 

3) 在 缺乏 二 维 设计 图 样 或 者 原始 设计 参数 情况 下 ， 在 对 零件 原型 进行 测量 的 基础 上 ， 
形成 零件 的 CAD 数字 模型 ， 以 便利 用 现 有 的 计算 机 辅助 分 析 (CAE)、 计 算 机 辅助 制造 
(CAM) 等 先进 技术 ， 进 行 新 产品 的 技术 开发 。 

4) 在 模具 行业 ， 通 常 需要 反复 修改 原始 设计 的 模具 型 面 ， 得 到 符合 要 求 的 模具 。 因 
此 ， 设 计 者 们 常 借 助 于 逆向 工程 的 功能 建立 或 修改 制造 过 程 中 变更 过 的 设计 模型 。 

5) 很 多 物品 很 难 用 基本 几何 来 表现 与 定义 ,例如 流线型 产品 、 艺 术 浮 雕 及 不 规则 线条 
等 。 如 果 利 用 通用 CAD 软件 以 正 向 设计 的 方式 来 重建 这 些 物 体 的 CAD 模型 ， 在 功能 、 速 度 
及 精度 方面 都 将 异常 困难 。 在 这 种 场合 下 ， 引 入 逆向 工程 ， 可 以 加 速 产 品 设 计 ， 降 低 开 发 难 
度 。 

3. 产品 质量 检验 

视觉 测量 在 产品 检验 领域 中 的 应 用 十 分 活跃 ， 如 电子 工业 行业 对 电路 板 的 自动 检测 ， 汽 
车 行业 中 的 总 装 线 上 的 检测 ， 农 业 生产 中 的 农产品 品质 检测 和 分 类 分 析 ， 机 械 行业 中 的 机 械 
零件 自动 识别 和 几何 及 二 测量 及 表面 粗糙 度 和 表面 缺陷 检测 等 ， 以 及 治 金 行 业 中 钢板 表面 裂 
纹 检 测 和 焊接 的 焊 缝 质量 检测 等 。 

计算 机 视觉 在 汽车 行业 的 应 用 比较 广泛 ， 例 如 汽车 车 间 识 别 汽车 车 身 类 型 、 油 漆 车 间 的 
零件 识别 、 晶 车 车 身 的 全 身 质 量 检测 等 。 在 我 国 ， 天 津 大 学 开发 了 我 国 首 人 台 IVECO ， 应 用 
于 汽车 制造 业 中 。 其 视觉 测量 主要 是 用 在 轿车 车 喘 生产 线 ， 对 车 映 侧 围 、 底 盘 及 车 映 总 长 关 
键 尺寸 进行 测量 ， 还 用 于 生产 线 中 机 械 手 的 定位 、 有 瞄准 ， 从 而 实现 了 机 械 手 自动 化 安 波 ， 并 
大 大 提高 了 产品 质量 和 生产 效率 ， 降 低 了 生产 成 本 。 天 津 大 学 还 开发 了 我 国 首 台 白 车 车 身 激 
光 视 觉 检查 站 ,实现 了 整个 车 身 的 三 维 尺寸 的 日 动 测量 。 该 系统 属于 固定 式 测量 系统 ， 并 采 
用 了 多 传感器 融合 结构 ， 共 有 33 个 视觉 传感器 ，3 个 定位 传感器 等 多 种 类 型 传感器 。 计 算 
机 采集 检测 点 图 像 并 进行 处 理 ， 计 算 值 与 标准 值 进行 比 对 ， 得 出 检测 结果 。 英 国 ROVER 汽 
车 公司 研制 了 系列 汽车 车 身 轮廓 尺寸 的 在 线 测量 系统 。 该 系统 由 多 组 测量 单元 组 成 ， 同 时 测 
量 不 同 测 点 ， 可 以 测量 三 种 类 型 的 车 身 ， 操 作用 时 40s， 通 过 对 关键 部 分 尺寸 的 判别 ， 进 行 
车 身 的 质量 控制 。 美 国 Perceptron 公司 的 车 身 视觉 测量 系统 共有 29 个 CCD 视觉 传感器 ， 安 
装 在 系统 的 不 同位 置 ， 分 别 测量 边 、 角 、 孔 等 位 置 和 特征 ， 通 过 统一 的 图 像 处 理 来 得 到 整个 
车 映 的 外 形 尺寸 。 这 种 视觉 坐标 测量 技术 的 测量 误差 一 般 为 + (0.03 ~0.05) mm， 其 测量 
精度 主要 受 机 架 的 刚性 、 长 期 稳定 性 和 系统 标定 方法 精度 的 限制 。 车 身 检测 系统 示意 图 如 图 
1. 10 所 示 。 

4. 在 导航 中 的 应 用 
在 车 辆 、 机 器 人 等 的 导航 中 ， 可 以 用 同一 时 刻 的 关于 场景 某 一 视点 的 两 幅 二 维 图 像 还 原 
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1.10 ”多 视觉 测量 系统 一 一 车 身 检测 系统 示意 图 
出 场景 三 维 信息 ， 进 而 完成 自身 的 定位 与 姿态 估计 ， 最 终 实 现 路 径 规划 、 自 主导 航 、 与 周围 
环境 自主 交互 等 。 

例如 ，2001 年 瑞典 ABB 机 器 人 公司 采用 IRB340 型 6 自由 度 机 器 人 ， 为 西班牙 Mildred 
食品 公司 开发 的 新 月 牙 面 包 视觉 分 拣 线 。 系 统 采用 逐 行 扫描 智能 图 像 摄 像 机 对 生产 线 上 密集 
排列 的 大 量 高 温 出 箱 的 面包 图 像 进行 采集 ， 经 图 像 分 割 确定 面包 在 运动 生产 线 上 的 位 置 ， 由 
中 轴 提 取 算 法 计算 面包 偏 置 角度 ， 最 后 由 15 个 IRB340 型 机 器 人 根据 视觉 信息 进行 面包 分 














0) 图 像 获 取 系统 d) 机 器 人 抓 取 系统 











图 1.11 视觉 系统 在 食品 工业 化 生产 中 的 应 用 





拣 。 整 个 过 程 无 人 工 干 预 ， 避 免 了 工人 高 温 作 业 ， 同 时 保 
证 食品 的 卫生 质量 。 其 检测 系统 如 图 1. 11 所 示 。2002 年 谷 
口 庆 治 人 研制 了 一 种 自动 搬运 冲压 零件 机 器 人 。 该 机 器 人 首 
先 用 线 状 光 投 影 方法 ， 除 去 金属 表面 镜面 反射 所 产生 的 伪 
三 维 信息 ， 同 时 计算 物体 上 三 维 位 置 矢 量 和 法 线 矢 量 ， 检 
出 物体 的 表面 信息 。 再 从 检测 出 的 表面 信息 中 恢复 可 保持 
的 稳定 位 置 ， 然 后 利用 真空 吸盘 吸 起 物体 进行 搬运 ， 实 现 
机 器 人 高 速 旦 稳定 地 搬运 工件 。2007 年 英国 英格兰 萨 里 大 
学 的 Munir Zaman 博士 采用 两 台 CCD 摄像 机 用 于 机 器 人 定 
位 ,设计 了 一 种 所 谓 的 视觉 里 程 计 定位 机 器 人 ， 如 图 1. 12 
所 示 。 它 通过 对 摄像 机 采集 到 的 地 面 图 像 进行 分 析 ， 利 用 
航 迹 推算 方法 求 取 机 器 人 当前 的 位 置 。 实 验 结 果 表明 ， 该 
系统 分 辩 率 与 传统 里 程 计 相当 ， 但 能 大 大 降低 轮子 滑 移 等 非 系统 误差 对 定位 精度 的 影响 。 


1.2.9 计算 机 视觉 测量 技术 的 发 展 趋势 


计算 机 视觉 测量 技术 是 一 种 具有 广泛 应 用 前 景 的 自动 检测 技术 ， 可 以 实现 智能 化 、 柔 
性 、 快 速 和 低 成 本 的 检测 。 

1. 从 视觉 测量 技术 应 用 角度 看 视觉 测量 技术 的 发 展 趋势 

(1) 实现 在 线 实 时 检测 

视觉 测量 系统 大 多 用 在 工业 现场 及 工业 生产 线 中 ， 对 于 在 线 实 时 检测 ， 如 何 将 视觉 测量 
系统 能 入 到 生产 线 相应 的 工序 中 ， 使 测量 速度 与 生产 线 节拍 相 一 致 ， 是 视觉 测量 走 上 实际 应 
用 的 关键 。 视 觉 测量 执行 时 间 在 很 大 程度 上 取决 于 底层 图 像 处 理 (图 像 平 滑 、 滤 波 、 分 割 
等 ) 速度 。 因 此 ， 使 用 专用 硬件 实现 独立 于 环境 的 处 理 算法 ， 可 大 大 提高 图 像 处理 速 度 。 

(2) 实现 智能 化 检测 

制造 业 中 智能 化 仪器 一 般 利 用 许多 传感器 获得 测量 信息 ， 从 而 得 出 所 需 的 测量 结果 ， 对 
加 工 过 程 进行 控制 。 仪 器 智能 化 是 融合 智能 技术 、 传 感 技术 、 信 息 技术 、 仿 生 技 术 、 材 料 科 
学 等 的 一 门 综合 交叉 学 科 ， 使 检测 的 概念 过 渡 到 在 线 、 动 态 、 主 动 的 实时 检测 与 控制 。 例 
如 ， 从 CAD 系统 中 提取 零件 视觉 模型 和 检测 信息 (包括 零件 位 置 、 方 向 、 摄 像 机 视角 等 )， 
选 定 检测 项 目 、 检 测 点 和 检测 路 径 ， 建 立 智 能 检测 规划 ， 并 控制 工业 机 器 人 抓 取 零件 并 放置 
到 合适 的 位 置 进行 检测 。 

(3) 实现 高 精度 检测 

随 着 现代 科学 技术 的 不 断 发 展 ， 众 多 高 科技 领域 均 已 进入 了 纳米 世界 ， 如 精密 元 器 件 、 
电子 工业 高 密度 半导体 集成 电路 等 。 纳 米 技术 的 加 工 离 不 开 纳米 精度 的 测量 技术 和 设备 ， 这 
就 对 计算 机 视觉 测量 技术 提出 了 更 高 的 要 求 。 从 成 像 角度 看 ， 需 要 研究 更 精密 的 光学 成 像 系 
统 、 光 电 转 换 装 置 及 视频 、 图 像 采 集 卡 。 从 图 像 处 理 与 分 析 的 角度 看 ， 传 统 的 视觉 测 量 技术 
的 定位 精度 为 整 像素 级 ， 理 论 上 其 边缘 定位 最 大 误差 为 0.5 个 像素 。 随 着 工业 检测 等 实际 应 
用 对 精度 要 求 的 不 断 提 高 ， 像 素 级 精度 已 经 不 能 满足 实际 测量 的 要 求 。 因 此 ， 如 何 采用 更 高 
精度 的 图 像 处 理 算法 越 来 越 受 到 人 们 的 重视 。 

(4) 网 络 化 
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网 络 技术 的 出 现 ， 极 大 地 改变 着 人 们 生活 的 各 个 方面 。 具 体 到 测量 技术 领域 ， 有 远程 数 
据 采集 与 测量 ， 远 程 设 备 故 障 诊断 ， 电 、 水 、 燃 气 、 热 能 等 的 自动 抄 表 等 ， 这 些 都 是 网 络 技 
术 进 步 并 全 面 发 挥 作用 的 必然 结果 。 

目前 ， 测 控 系 统 的 设计 思想 明显 受到 计算 机 网 络 技术 的 影响 ， 测 控 网 络 由 传统 的 集中 模 
式 转变 为 分 布 模式 ， 成 为 具有 开放 性 、 可 互 操作 性 、 分 散 性 、 网 络 化 、 智 能 化 的 测控 系统 。 
网 络 的 节点 上 不 仅 有 计算 机 、 工 作 站 ， 还 有 智能 测控 仪器 仪表 。 测 控 网 络 有 着 与 信息 网 络 相 
似 的 体系 结构 和 通信 模型 ， 例 如 目前 测控 系统 中 迅猛 发 展 的 现场 总 线 ， 它 的 通信 模型 和 OSI 
模型 对 应 ， 将 现场 的 智能 仪表 和 装置 作为 节点 ， 通 过 网 络 将 节点 与 控制 室内 的 仪器 仪表 和 控 
制 装置 连 成 有 机 的 测控 系统 。 

(5) 实现 柔性 测量 技术 

目前 ， 几 乎 所 有 计算 机 视觉 测量 系统 都 只 适用 于 解决 特定 的 检测 任务 ， 建 立 一 种 较为 通 
用 的 视觉 测量 系统 ， 以 适用 于 不 同 条 件 下 的 检测 任务 ， 进 而 实现 对 目标 进行 “完全 检测 ”。 
这 是 目前 和 将 来 视觉 检测 系统 的 发 展 方向 。 

2. 从 视觉 检测 对 象 角度 看 视觉 测量 技术 的 发 展 趋势 

(1) 微 结构 尺寸 检测 

微 结构 尺寸 检测 是 微机 械 研 究 与 加 工 中 经 常 遇 到 的 问题 ， 传 统 方法 主要 采用 万 能 工具 显 
微 镜 或 者 激光 衍射 法 。 前 者 容易 受 测 尖 形状 、 大 小 及 测 力 的 影响 ,后 者 对 测量 环境 要 求 苛 
刻 ， 同 时 只 能 测量 较为 简单 的 结构 尺寸 (如 细 丝 直径 、 薄 带宽 度 等 ) ， 对 于 较 复 杂 的 微 结 构 
尺寸 及 像 光纤 等 透明 、 易 变形 的 目标 ， 两 者 均 无 能 为 力 。 

视觉 检测 技术 具有 非 接 触 的 特点 ， 并 且 不 一 定 采用 相干 光源 ， 因 此 其 测量 过 程 不 会 受到 
测 头 、 测 力 、 相 和 干 光 的 影响 。 视 觉 测量 精度 和 范围 与 摄像 系统 的 分 辨 率 和 放大 倍数 密切 相 
关 ， 调 整 摄像 系统 的 放大 倍数 和 采用 高 分 辩 率 的 CCD， 可 实现 大 范围 测量 (微米 级 到 毫米 
级 ) ， 同 时 保证 较 高 的 测量 精度 。 

(2) 大 型 结构 尺寸 检测 

大 型 结构 尺寸 ， 传 统 测量 主要 采用 两 种 方法 : 一 是 直接 法 ， 即 采用 大 尺寸 导轨 或 标准 件 
进行 测量 ， 成 本 高 、 精 度 低 、 操 作 不 方便 ; 二 是 间接 法 ， 如 号 高 弦 长 法 、 滚 子 法 等 ， 这 类 方 
法 本 身 存 在 测量 原理 误差 ， 并 且 测 量 可 靠 性 不 高 。 

对 于 大 型 零件 ， 视 觉 测 量 技术 可 对 零件 的 不 同 部 位 进行 拍摄 ， 得 到 多 幅 局 部 重 秋 的 图 
像 ， 然 后 利用 图 像 之 间 的 信息 元 余 进行 图 像 拼 接 得 到 零件 的 完整 图 像 ， 对 拼接 后 的 图 像 进行 
分 析 可 以 得 到 零件 的 完整 结构 尺寸 。 它 具有 简单 经 济 的 特点 ， 同 时 能 够 达到 较 高 的 精度 。 

(3) 复杂 结构 尺寸 检测 

齿轮 、 螺 纹 、 凸 轮 等 均 是 机 械 制 造 领域 中 常用 的 重要 零件 ， 这 些 零 件 形状 复杂 、 参 数 繁 
多 ,通常 采用 专用 测量 仪器 ， 测 量 过 程 复杂 、 成 本 高 。 视 觉 测量 技术 采用 “图 像 ” 这 种 信 
息 含量 非常 丰富 的 信息 载体 ， 从 而 表现 出 较 大 优势 。 螺 纹 、 齿 轮 等 零件 的 复杂 轮廓 信息 ， 只 
需 一 幅 或 多 幅 图 像 就 可 以 获得 。 

(4) 自由 曲面 测量 

自由 曲面 通常 指 无 法 确切 用 解析 几何 的 方法 描述 的 曲面 ， 如 火箭 、 飞 机 、 汽 车 等 复杂 的 
外 观 造 型 。 自 由 曲面 的 高 精度 测量 技术 ， 目 前 成 为 研究 的 热点 问题 。 自 由 曲面 传统 的 测量 方 
法 有 手工 测量 法 、 机 器 人 测量 法 、 三 坐标 测量 法 、 经 纬 仪 组 合 测量 法 等 。 以 上 方法 与 现代 工 
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业 要 求 的 100% 在线 测量 存在 一 定 的 差距 。 将 机 顺 视 觉 测量 技术 和 结构 光 应 用 于 自由 曲面 测 
量 ， 其 测量 速度 、 工业 强度 均 优 于 以 上 方法 ， 并 且 测 量 精度 与 三 坐标 测量 法 相当 。 例 如 ， 大 
型 雷达 的 曲面 测量 应 用 等 。 


1.2.10 计算 机 视觉 测量 的 流程 
视觉 测量 系统 图 像 测 量 系统 流程 如 图 1. 13 所 示 ， 视 觉 测量 需 经 过 如 下 步骤 : 





























图 1.13 ”图像 测量 系统 流程 

1) 在 建立 计算 机 视觉 测量 系统 的 基础 上 ， 完 成 图 像 采集 。 

2) 在 采集 图 像 的 基础 上 ， 根 据 测 量 任务 的 需要 ， 完 成 摄像 机 系统 的 标定 ， 包 括 摄像 机 
内 外 参数 标定 和 双 摄 像 机 系统 结构 参数 的 标定 。 

3) 由 于 采集 的 图 像 受 到 图 像 传 感 咒 内 部 噪声 和 外 部 环境 的 干扰 ， 不 可 避免 地 会 出 现 各 
种 噪声 。 因 此 ， 需 要 先 对 采集 的 图 像 进 行 滤 品 和 增强 。 增 强 图 像 的 对 比 度 并 使 图 像 特征 突 
出 。 

4) 图 像 预 处 理 后 ， 图 像 质量 得 到 了 改善 。 接 下 来 进行 图 像 分 制 ， 即 目标 检测 。 针 对 测 
量 需求 ， 分 割 图 像 中 测量 目标 的 特征 点 。 

5) 在 分 割 目标 特征 点 的 基础 上 ， 完 成 图 像 中 目标 的 二 维 参数 测量 ， 包 括 特征 点 坐标 测 
量 和 图 像 目 标尺 十 测量 。 

6) 在 摄像 机 标定 和 二 维 图 像 测 量 结果 的 基础 上 ， 完 成 空间 三 维 坐标 测量 或 空间 几何 参 
数 测量 。 

7) 测量 结果 输出 ， 包 括 显 示 、 存 储 、 打 印 等 。 
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第 2 音 计算 机 视 党 测量 系统 


计算 机 视觉 测量 系统 是 指 计算 机 视觉 测量 中 所 涉及 的 硬件 设备 ， 通 过 这 些 硬件 设备 可 以 
建立 完整 、 有 效 的 视觉 测量 系统 。 由 第 1 章 内 容 可 知 ， 一 般 的 视觉 测量 系统 由 光源 照明 系 
统 、 光 学 成 像 系 统 〈 即 摄像 机 系统 ) 和 光电 转换 装置 、 图 像 采 集 装 置 ( 即 图 像 采集 卡 ) 及 
图 像 处理 系 统 〈 即 计算 机 系统 ) 组 成 。 本 章 将 对 其 硬件 系统 作 详 细 介 绍 。 


2.1 光源 照明 系统 
计算 机 视觉 测量 系统 中 一 般 使 用 透射 光 和 反射 光 。 透 射 光 是 指 光源 照射 到 被 测 物体 上 


后 ， 透 过 被 测 物 被 摄像 机 光学 系统 接收 成 像 的 光线 。 反 射 光 是 指 光源 照射 到 物体 上 后 反射 进 
入 光学 系统 的 光线 。 如 图 2. 1 和 图 2. 2 所 示 ， 不 同 的 光源 与 照明 方式 及 不 同 颜色 光源 具有 不 


/ 
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图 2.1 不 同 光 源 和 照明 方式 的 照明 效果 
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2.2 不 同 颜色 光源 的 照明 效果 示例 

同 的 照明 效果 。 光 源 系统 与 照明 方案 往往 是 整个 系统 成 败 的 关键 。 

光源 照明 系统 并 不 是 简单 地 照 亮 物体 ， 而 是 要 具有 如 下 特点 : 

1) 要 求 尽 可 能 突出 物体 的 特征 量 。 如 检测 划 痕 ， 就 要 突出 划 痕 特征 ; 检测 物体 表面 的 
字符 ， 就 要 突出 字符 特征 。 这 与 光源 和 照明 方式 都 有 关系 。 

2) 在 物体 需要 检测 的 部 分 与 次 要 部 分 之 间 尽 可 能 产生 明显 区 别 ， 增 强 对 比 度 。 只 有 对 
比 度 好 ， 图 像 质量 才能 好 ， 才 能 有 效 地 分 割 目标 。 

3) 应 保证 足够 的 整体 亮度 。CCD 有 一 定 的 光照 度 要 求 。 

4) 物体 位 置 的 变化 不 影响 成 像 质 量 。 检 测 时 往往 需要 移动 物体 ， 或 放置 物体 时 定位 不 
是 十 分 准确 ， 这 就 要 求 在 一 定 范围 内 ， 物 体位 置 变换 不 会 影响 照明 效果 。 


2.1.1 光源 系统 


光源 设备 的 选择 必须 符合 所 需 的 几何 形状 和 性 能 参数 。 光 源 的 性 能 参数 包括 发 光 强 度 
(发 光亮 度 ) 、 均 匀 性 、 光 谱 特 性 、 发 光 效 率 、 使 用 寿命 、 费 用 等 。 下 面 说 明 一 下 比较 重要 
的 三 个 参数 ， 

1) 发 光 强 度 (Intensity) : 发 光 强 度 不 够 会 降低 图 像 的 对 比 度 ， 而 过 大 则 功 耗 大 并 需 散 
热处理 。 随 着 光源 距离 和 角度 变化 发 光 强 度 也 会 产生 变化 。 

2) 均匀 性 (Uniformity) : 均匀 性 好 是 计算 机 视觉 测量 系统 对 光源 的 基本 要 求 。 

3) 光谱 (Spectrum) 特性 : 即 光 的 颜色 ， 主 要 取决 于 光源 类 型 及 光源 和 镜头 的 滤 光 片 
性 能 。 

光源 的 选用 要 充分 考虑 上 述 性 能 参数 。 例 如 ，CCD 器 件 的 光谱 响应 范围 为 200 ~ 
1100nm， 峰 值 响应 波长 为 550nm， 选 用 光源 是 要 使 光谱 响应 灵敏 度 接 近 于 其 峰值 响应 波长 
的 光谱 响应 灵敏 度 。 如 和 氧气 激光 器 的 激光 波长 为 632. g8nm， 与 其 他 激光 器 相 比 ， 其 相同 功率 
的 光束 可 得 到 较 大 的 输出 信号 。 
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2.1.2 常用 可 见 光 光 源 


常用 可 见 光 光源 可 分 为 普通 光源 和 新 型 光源 。 普 通 光 源 包括 热 辐射 光源 和 气体 放电 光 
源 ， 如 白炽 灯 、 汞 灯 、 钠 光 灯 等 。 普 通 光 源 的 优点 : 能 够 满足 检测 需要 、 容 易 获取 且 性 价 比 
高 。 普 通 光源 的 缺点 : 光源 不 稳定 ， 随 着 使 用 时 间 的 沿 长 ， 光 量 会 下 降 ， 受 环境 光影 响 较 
大 ， 有 时 需要 加 防护 屏 。 

新 型 光源 包括 场 致 发 光 光 源 〈 半 导体 光源 ) 、 物 理光 源 ， 如 LED、 激 光 光 源 等 。 新 型 光 
源 的 优点 : LED 光源 寿命 长 、 光 亮度 稳定 、 易 调节 、 反 应 快 、 功 率 小 、 成 本 低 ， 是 绿色 光 
源 ; 激光 光源 单 色 性 好 、 方 向 性 强 、 发 光 强 度 极 高 、 相 干 性 好 。 常 用 照明 光源 如 图 2.3 所 
示 ， 下 面 将 对 常用 普通 光源 和 新 型 光源 中 的 典型 光源 作 详 细 介 绍 。 





图 2.3 常用 照明 光源 

1. 普通 光源 

(1) 钢丝 白炽 灯 

普通 白炽 灯 是 由 熔点 高 达 3600K 的 钨 丝 制 成 的 灯丝 、 实 心 玻 璃 、 钼 丝 钩 、 灯 头 、 玻 璃 
壳 组 成 的 ， 如 网 2.4 所 示 。 

灯丝 是 白炽 灯 的 关键 部 分 ， 由 钨 丝 统制 成 单 螺旋 形 或 双 螺 
旋 形 。 为 使 白炽 灯 产 生 的 光 通 量 按 预期 的 空间 分 布 ， 可 将 钨 丝 
制 成 直射 状 、 环 状 或 锯齿 状 。 锯 齿 可 布置 成 平面 、 圆 柱 形 或 
锥 形 。 忽 丝 即 钨 电阻 ， 其 电阻 值 由 灯丝 的 长 度 和 直径 决定 。 供 
电 电压 一 定 的 情况 下 ， 灯丝 中 流 过 的 电流 由 电阻 决定 。 忽 丝 通 
过 金属 丝 与 外 电源 连接 。 

实心 玻璃 和 钼 丝 钧 构成 铝 丝 支撑 架 。 玻 璃 过 一 般 采 用 透明 
的 普通 玻璃 。 有 时 为 得 到 均匀 发 射 的 亮度 较 低 的 白光 ， 会 对 透 
明 的 玻璃 过 表面 加 以 腐蚀 (磨砂 ) 或 用 散光 性 强 的 乳白 玻璃 制 
成 玻璃 克 。 为 防止 高 温 时 钨 丝 氧 化 ， 常 把 玻璃 壳 抽 成 真空 。 图 2.4 白炽 灯 
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很 多 时 候 为 避免 钨 丝 蒸发 〈 灯 泡 变 黑 ) ， 玻 璃 壳 内 常 充 人 惰性 气体 。 对 于 功率 大 于 40W 
的 白炽 灯 ， 玻 璃 过 内 要 充满 惰性 气体 ， 以 减少 钨 丝 蒸发， 延长 其 寿命 。 但 惰性 气体 分 子 也 散 
失 部 分 热量 ， 使 钨 丝 温 度 降低 ， 所 以 最 好 充 人 大 量 的 所 和 氢 。 

忽 丝 白炽 灯 属 于 热 辐 射 体 ， 即 在 电流 的 作用 下 维持 钨 丝 温度 而 产生 辐射 。 温 度 较 低 时 ， 
热 辐 射 体 的 黑 度 系数 较 小 ， 且 光谱 黑 度 系数 随 波 长 的 增长 而 减少 。 因 此 当 铭 丝 白炽 灯 的 温度 
较 低 时 ， 它 所 发 出 的 辐射 出 射 度 较 弱 ， 光 颜色 发 红 。 

当 温 度 升 高 时 ， 光 谱 黑 度 系数 随 波 长 的 变化 而 减 小 ， 最 后 在 温度 很 高 时 趋 近 于 1 ， 服 从 
黑体 辐射 定律 。 因 此 ， 忽 丝 白 炽 灯 的 温度 越 高 ， 它 所 发 出 的 辐射 出 射 度 越 强 。 

由 普 朗 克 和 维 恩 移 位 定律 知道 ， 铭 丝 的 温度 越 高 短波 长 光谱 辐射 的 售 量 越 多 。 忽 丝 白 炽 
灯 的 发 光 光 谱 范 围 涵盖 了 整个 可 见 光 谱 谱 区 ， 并 延长 至 中 红外 区 。 其 光谱 连续 。 它 在 可 见 光 
谱 区 的 辐射 功率 只 占 全 部 辐射 功率 的 一 小 部 分 ， 不足 10% 。 

忽 丝 白炽 灯 的 功率 是 指 其 电功率 ， 忽 丝 越 短 直 径 越 大 ， 则 灯丝 的 电功率 越 高 。 钨 丝 白 炽 
灯 的 光 通 量 可 简单 理解 为 其 光 功 率 ， 钨 丝 温 度 越 高 ， 光 通 量 约 大 。 

忽 丝 白炽 灯 的 发 光 效 率 的 规律 是 ， 忽 丝 温度 越 高 ， 发 光 效 率 越 高 。 小 功率 指示 灯 的 灯丝 
细 、 温 度 低 、 发 光 效 率 较 低 。 

综 上 所 述 ， 对 于 铭 丝 白炽 灯 ， 灯丝 参数 (长度 、 直 径 等 ) 决定 其 电阻 值 ， 进 而 决定 其 
电功率 的 大 小 。 电 功率 越 大 则 发 光 效 率 越 高 ， 反 之 发 光 效率 低 。 发 光 效 率 越 高 ， 灯 的 光 通 量 
越 大 ， 发 光 强 度 也 越 大 ， 反 之 亦 然 。 上 述 关 系 如 下 : 
灯丝 参数 一 | 功率 ”一 发 光 效率 一 | 光 通 量 | 一 | 发 光 强 度 


钨 丝 白 炽 灯 要 求 在 稳定 电压 下 发 出 稳定 的 光 辐 射 。 供 电 电 压 变 化 ， 对 白炽 灯 的 电流 、 光 
通 量 、 功 率 损耗 、 寿 命 等 都 有 很 大 影响 。 

电压 增高 ， 则 灯丝 的 温度 上 升 ， 光 通 量 增加 ， 发 光 效 率 提高 。 但 是 灯丝 的 温度 太 高 时 ， 
灯丝 燕 发 加 快 ， 使 灯丝 的 某 些 局 部 迅速 变 细 ， 从 而 电阻 值 增 大 ， 局 部 功 耗 加 大 ， 并 很 快 烧 
断 。 电 压 降 低 ， 则 发 光 不 足 ， 但 寿命 延长 。 

例如 ， 对 于 真空 钨 丝 白 炽 灯 ， 要 使 光 通 量 增加 18% ， 需 提高 电压 5% ， 但 寿命 会 降低 
50% 。 反 之 ， 若 把 钨 丝 白炽 灯 额 定 电 压 从 220V 降 为 180V， 光 通 量 就 降低 52% ， 而 寿命 却 
增加 13.6 倍 。 

(2) 元 钨 灯 

讽 忽 灯 是 一 种 改进 的 白炽 灯 ， 如 图 2.5 所 示 。 灯 丝 亮度 
高 、 形 体 小 、 成 本 低 。 常 用 的 贞 铭 杂 有 碘 铭 灯 和 省 钨 灯 。 

忽 灯 丝 在 高 温 下 蔡 发 会 使 灯泡 变 黑 ， 如 果 限 定 白 炽 灯 的 
灯丝 温度 不 能 太 高 ， 会 使 白炽 灯 的 发 光 效 率 降 低 。 讽 铭 灯 是 
在 灯 中 充 人 碘 或 省 等 讽 族 元 素 ， 使 它们 与 薰 发 在 玻璃 过 上 的 
钨 丝 形 成 化 合 物 。 当 这 些 化 合 物 回 到 灯丝 附近 时 ， 遇 高 温 而 
分 解 ， 钨 又 回 到 灯丝 上 。 这 样 灯丝 的 温度 可 以 大 大 提高 ， 而 
玻璃 过 并 不 发 黑 。 

(3) 气体 放电 灯 = 

气体 放电 灯 包 括 稀 有 气体 灯 (和 氨 灯 等 ) 、 金 属 气体 灯 (来 图 2.5 出 忽 灯 
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灯 、 钠 灯 等 )。 它 们 的 共同 特点 是 气体 放电 ， 光 谱 不 连续 。 
通常 情况 下 ， 气体 是 不 导电 的 ,但 在 宇宙 射线 的 作用 下 ,会 有 少量 气体 分 子 被 电离 成 
正 、 负 离子 和 自由 电子 。 如 当 示 蒸 气 气 压 为 133. 32Pa 时 ， 对 密封 在 玻璃 管内 的 两 个 电极 加 
一 定 的 电压 ， 当 电压 较 低 时 ， 玻 璃 管内 只 有 少量 负离子 和 自由 电子 导电 ， 形 成 微弱 的 电流 ， 
即 气体 暗 放电 电流 。 这 时 电流 与 电压 呈 线 性 关系 。 随 着 电压 的 增加 ， 电 流 达到 饱和 。 电 压 继 
续 增 加 时 ， 由 于 粒子 的 碰撞 ， 带 电 粒 子 数 雪崩 似 地 增加 ， 正 离子 高 速 艇 击 阴 极 ， 打 出 了 二 次 
电子 。 这 时 电流 迅速 增加 ， 产 生 了 辉 光 放 电 现 象 。 这 就 是 气体 放电 。 

稀有 气体 包括 氮 、 氛 、 握 、 气 、 筷 等 气体 ， 由 于 一 般 不 与 其 他 物质 发 生化 学 反应 ， 在 一 些 
工业 生产 中 常 作为 保护 气 。 例 如 ， 用 电弧 焊接 火箭 、 飞 机 、 轮 船 、 导 弹 等 用 的 不 锈 钢 、 铝 或 馈 
合金 等 时 ， 可 以 用 氮气 来 隔绝 空气 ， 防 止 金属 在 高 温 下 跟 其 他 物质 起 反应 。 由 于 氨 气 比 空气 
轻 ， 又 不 会 燃烧 ， 现 在 已 用 它 代替 氢气 充填 气球 、 飞 艇 。 氨 气 与 氧气 可 以 混合 制 成 人 造 空气 。 

充 人 稀有 气体 的 灯 ， 称 为 稀有 气体 灯 。 把 氯气 和 氮气 混合 充 和 人 
灯泡 里 ， 可 使 灯泡 经 久 耐 用 。 在 灯 管 里 充 入 氛 气 的 氛 灯 ， 通电 时 发 
出 的 红色 光 ， 能 透 过 浓 雾 ， 可 用 作 航 空 、 航 海 的 指示 灯 。 在 灯 管 里 
充 人 人 氯气 的 氯 灯 ， 通 电 时 发 出 蓝 紫 色光 。 在 灯 管 里 充 和 人 氨 气 的 氨 灯 ， 
通电 时 发 出 粉红 色光 。 在 不 同 材质 的 玻璃 灯 管 里 充 人 不 同 含量 的 所 、 
氛 、 毛 的 混合 气体 ， 就 能 制 得 五 光 十 色 的 霓虹灯 。 在 灯 管 里 充填 少 
量 的 汞 和 人 氯气， 灯 管 的 内 壁 涂 上 荧光 物质 ， 通 电 时 就 能 发 出 近似 日 
光 的 可 见 光 ， 所 以 叫 荧光 灯 。 

如 图 2.6 所 示 ， 氨 灯 是 由 充 有 和 氯气 的 石英 灯泡 组 成 ， 用 高 压 触 
发 放电 。 人 和 拨 灯 分 为 长 弧 氨 灯 、 短 弧 氨 灯 、 脉 冲 氨 灯 。 长 弧 氨 灯 其 光 图 2.6 会 灯 
谱 与 日 光 非 常 接近 ， 俗 名 “小 太阳 ”， 此 种 迄 灯 穿 雾 能 力 特别 强 ， 和 常用 于 车 站 、 码 头 和 广场 
照明 。 短 弧 氨 灯 的 色彩 类 似 于 中 午 的 日 光 ， 色 温 高 (5600K) ， 使 用 方便 ， 是 目前 理想 的 人 
造 “ 太 阳 灯 ”， 多 用 于 电影 放映 和 舞台 照明 。 

脉冲 得 灯 是 一 种 点 亮 时 间 很 短 的 脉冲 闪光 光源 ， 俗 称 “ 闪 光 灯 ”。 可 分 为 单 次 闪光 和 重 
复 内 光 。 脉 冲 光 与 CCD 转移 脉冲 同步 后 可 以 获得 高 速 运动 物体 的 瞬 态 图 像 ， 在 高 速 摄影 技 
术 中 获得 了 广泛 应 用 。 除 激光 光源 外 ， 脉 冲 握 灯 的 亮度 最 高 ， 光 谱 分 布 范 围 较 宽 。 

脉冲 握 灯 控制 电路 原理 图 如 图 2.7 所 示 。 对 单 次 闪光 电路 ， 电 源 对 电容 C, 充电 至 几 千 
伏 ， 同时 对 C, 也 充电 。 当 开关 闭合 之 后 ，C, 通过 一 次 脉冲 线圈 放电 ， 在 二 次 侧 产生 很 高 的 
脉冲 电压 。 此 脉冲 电压 加 到 闪光 管 
的 电极 上 ， 使 内 光 管 触发 电离 ， 这 9 
时 存储 于 电容 C, 中 的 电能 通过 闪 
光 灯 形成 强烈 的 弧 光 放电 。C, 上 
的 电能 放电 完毕 ， 闪 光 完 成 一 次 。 下 六 电源 
充电 电阻 R, 除 对 电容 C, 充电 外 ， 
还 能 限制 充电 电流 的 大 小 ， 以 便当 
电容 C, 迅速 放电 时 ， 闪光 管 能 消 
除 电离 并 熄灭 ， 不 致 连续 闪光 。 

对 于 重复 多 次 闪光 电路 ， 通 常 图 2.7 单 次 闪光 电路 原理 图 
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用 一 个 多 谐振 器 所 驱动 的 冷 阴极 电子 管 代 蔡 开 关 S， 其 振荡 频率 范围 为 几 百 赫 效 到 几 千 赫 
效 。 

金属 蒸气 灯 包 括 未 灯 、 钠 灯 等 。 冬 灯 也 叫 水 银 蒙 气 灯 。 有 低压 和 灯 、 高 压 末 灯 和 超 高 压 
求 灯 。 隶 灯 是 在 石英 玻璃 管内 加 入 来 ， 当 灯 点 燃 时 ， 灯 中 的 来 蒸发 ， 隶 藻 气 增 至 儿 个 大 气 
压 ， 从 而 产生 辉 光 放 电 。 

永 灯 主要 发 射 紫 外 单 色光 谱 ， 也 有 几 条 可 见 光 和 红外 谱 线 。 仪 器 用 高 压 汞 灯 可 以 用 作 校 
正光 谱 仪 器 或 用 作 其 他 用 途 。 

钠灯 是 在 钠 - 钙 玻璃 过 内 充 入 钠 蒸 气 ， 当 忽 丝 点 燃 后 ,发射 589. 0nm 和 589. 6nm 的 双 黄 
光 ， 可 用 来 作 光 谱 仪 器 或 其 他 用 途 。 

2. 新 型 光源 

常见 的 新 型 光源 包括 激光 光源 和 LED 光源 等 。 

(1) 激光 光源 

在 诸多 的 激光 光源 中 ， 氮 氛 激 光 器 和 半导体 激光 器 在 精密 检测 、 光 信息 处 理 、 准 直 导 向 
和 大 地 测量 中 应 用 非常 广泛 。 

激光 光源 的 特点 是 单 色 性 好 、 方 向 性 强 、 相 干 性 好 、 发 光 强 度 极 高 。 可 在 结构 光 测 量 中 
作为 光源 使 用 。 

(2) LED 

1) LED 的 发 光 机 理 对 于 GaAs ( 砷 化 儿 ) 和 GaP ( 磷 化 锋 ) 材料 的 半导体 二 极 管 ， 当 
正 向 偏 压 时 ， 非 平衡 载 流 子 不 断 复合 〈 电 子 空 穴 对 ) ， 将 多 余 的 能 量 以 光 的 形式 发 射出 去 
它 也 具有 普通 二 极 管 的 特性 。 

2) LED 的 种 类 ”中 发 光 光 谱 : 可 见 光 谱 和 红外 光谱 两 种 ， 可 见 光 有 红 、 检 、 绿 、 
白光 等 多 种 。 白 光 LED 在 照明 系统 中 应 用 最 广 ， ee ie 
种 单 色光 混合 发 出 白光 。@) 发 光 强 度 : 普通 亮度 发 光 二 极 管 [ < 100mcd 〈 毫 坎 德 拉 ) ] ， 高 
亮度 发 光 二 极 管 (100 ~ 1000mcd) ， 超 高 亮度 发 光 二 极 管 ( > 1000mcd) 。@ 发 光 管 出 光 面 
特征 : 圆 灯 、 方 灯 、 扼 形 灯 、 面 发 光 管 、 表 面 安装 用 微型 管 等 ， 圆 灯 直 径 为 2mm、4. 4mm、 
smm、8mm、l10mm、20mm。@ 由 发 光 强 度 角 高 指向 型 ， 标准 型 和 散射 型 。 高 指向 型 一 般 半 
强度 角 为 5° ~20° 或 更 小 ， 具 有 很 高 指向 性 ， 可 作 局 部 照明 光源 用 ; 标准 型 半 强 度 角 为 20。 
~45"， 通 常用 作 指示 灯 ; 散射 型 的 半 强 度 角 为 45° ~90° 或 更 大 。 

3) LED 的 优点 ”QD 效率 高 。 目 前 LED 的 发 光 效率 相对 白炽 灯 与 获 光 灯 并 不 高 ， 但 是 光 
谱 几 乎 全 部 集中 在 可 见 光 谱 ， 可 见 光 转换 效率 达到 80% ~ 90%。 白炽 灯 的 转换 效率 只 有 
10% ~20% ， 大 部 分 转换 为 热能 散发 掉 了 。 对 于 白光 LED ，1998 年 时 产品 的 光 效 为 5lm/W; 
1999 年 时 产品 的 光 效 为 15lIm/W， 与 一 般 白炽 灯 相 当 ; 2000 年 时 ， 日 立 公 司 的 试验 样品 光 歼 
达到 25lImAW， 可 与 疯 钨 灯 相 比 。2005 年 时 产品 的 光 效 为 40lm/W; 预计 2010 ~ 2015 年 ， 
LED 光 效 可 达 150 ~ 200lIm/W。@@ 体 积 小 、 重 量 轻 、 能 耗 小 、 光 亮度 高 。LED 采用 固体 封 
装 ， 结 构 牢 固 。LED 不 依靠 灯丝 发 热 来 发 光 ， 能 量 的 转化 效率 非常 高 ， 理 ; 0 
10% 的 能 耗 。 单 个 LED 的 功率 一 ee el ed 
3.5W 的 LED 灯 的 亮度 已 经 相当 于 40W 的 白炽 。 色 ) 使 用 寿命 长 ， 免 维护 。 Te 
理论 寿命 可 以 超过 10 万 小 时 。 i 亮度 50% 的 时 间 。 
现在 已 有 公司 的 产品 做 到 2 万 小 时 只 衰减 20% 。 由 于 LED 并 不 存在 灯丝 等 容易 熔断 的 问题 ， 
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也 没有 玻璃 等 易 损 部 件 ， 几 乎 不 需要 维护 费用 。@ 使 用 安全 。 低 电压 工作 ，LED 的 工作 电 
压 为 1.5 ~5V， 单 体 的 工作 电流 仅 为 20 ~70mA。@@ 光 源 单 色 性 好 。@ 使 用 灵活 ， 便 于 集成 。 
LED 光源 容易 用 计算 机 控制 ， 亮 度 便于 调整 。 广 泛 应 用 于 数字 仪表 显示 ， 大 屏幕 图 像 显 示 。 
可 做 成 任意 形状 的 光源 ， 广 泛 应 用 于 CCD 应 用 技术 中 ， 如 电子 眼 上 的 环形 的 光源 。C@O 绿 色 
环保 。LED 发 出 的 光线 没有 频 闪 ， 几 乎 不 含 紫 外 光 和 红外 光 ， 对 人 体 和 视力 没有 伤害 。 光 
源 全 固态 ， 不 像 其 他 可 见 光源 中 如 汞 灯 那 样 含有 毒物 质 。 

4) 适用 于 绿色 照明 ”目前 , 绿色 照明 的 科学 定义 是 指 通过 科学 的 照明 设计 ， 采 用 效率 
高 、 寿 命 长 、 安 全 和 性 能 稳定 的 照明 电器 产品 〈 电 光源 、 调 光 控制 和 控 光 部 件 ) ， 改 善 提 高 人 
们 工作 、 学 习 、 生 活 的 条 件 和 质量 ， 从 而 创造 一 个 高 效 、 舒 适 、 安 全 、 经 济 、 有 益 的 环境 并 充 
分 体现 现代 文明 的 照明 。 绿 色 照 明 应 从 以 下 诸多 方面 考虑 : 无 求 、 节 能 、 节 材 、 制 造 工 艺 环 
保 、 无 有 害 射线 、 耐 用 性 好 、 对 环境 无 电子 干扰 、 对 电网 无 损害 、 绿 色 上 废弃 。 固 体 光 源 的 
LED， 真 正点 燃 了 “绿色 照明 ”的 光辉 。 按 照 上 述 绿色 照明 的 要 求 ， 绝 大 部 分 气体 放电 光源 ， 
包括 第 三 代 HID (高 压气 体 放 电灯 ， 即 未 灯 ) 或 更 先进 的 HD， 都 比 LED 差 。 业 界 普遍 认为 
LED 是 21 世纪 最 有 价值 的 新 光源 。 将 取代 现 有 的 常用 可 见 光 源 ， 成 为 照明 市 场 的 主导 。 

5) LED 的 应 用 领域 ”中 显示 屏 、 交 通信 号 显示 光源 的 应 用 。LED 具有 响应 速度 快 、 节 
能 和 寿命 长 等 特点 。 因 此 广泛 用 于 各 种 室内 、 户 外 全 色 、 三 色 和 单 色 显示 屏 。 交 通信 号 灯 主 
要 用 超 高 亮度 红 、 绿 、 黄 三 色 LED。@@ 汽 车 工业 上 的 应 用 。LED 具有 抗 振 、 耐 冲击 特点 。 
超 高 亮度 功率 LED 的 出 现 ， 大 大 扩展 了 LED 在 各 种 信号 显示 和 照明 光源 领域 的 应 用 。 尤 其 
具有 代表 性 的 是 在 汽车 工业 ,包括 汽车 内 的 仪表 板 、 音 响 指示 灯 、 开 关 背 光源 、 外 部 的 刹车 
灯 、 尾 灯 、 侧 灯 及 头 灯 等 都 有 应 用 。@ 背 光源 。LED 具有 寿命 长 、 发 光 效 率 高 、 无 干扰 和 
性 价 比 高 的 特点 。 因 此 广泛 应 用 于 电子 手表 、 手 机 、 电 子 计 算 器 等 小 型 电子 产品 。LED 背 
光源 技术 向 更 薄 、 更 低 功 耗 和 更 均匀 一 致 方面 发 展 。@LED 照明 光源 。 早 期 的 LED 照明 由 
于 发 光 效率 低 ， 适 用 于 室内 场合 ， 如 家 电 、 仪 嚣 仪表、 通信 设 备 等 方面 。 目 前 ，LED 正在 
取代 白炽 灯 等 传统 照明 光源 ， 在 建筑 装饰 、 景 观照 明 、 休 闲 娱乐 场所 、 广 告 等 商业 领域 发 挥 
作用 。@@ 其 他 应 用 。 军 事 上 可 作为 野战 、 湾 水 、 航 天 航空 所 需 的 特种 固体 光源 。 也 可 作为 矿 
工 灯 等 便携 式 光 源 。 图 2. 8 所 示 为 几 种 LED 灯 外 形 。 

常用 照明 光源 性 能 比较 见 表 2. 1。 

表 2.1 常用 照明 光源 性 能 比较 





























































































































光 效 平均 寿命 
常用 光源 发 光 强 度 颜色 ”| 价格 其 他 特点 
/ (lm/W) /h 
白炽 条 | 1 低 1000 低 “| 显 色 性 好 ， 发 热 多 
( 低 ) | 偏 黄 | A 
讽 钨 灯 人 很 亮 旧 200 ~3000 高 显 色 性 好 ， 发 热 多 ， 体 积 小， 配合 光纤 
( 较 低 ) 偏 黄 ”| 导管 照明 
pt | 有 = 本 上 发 光 强度 高 ， 有 很 大 的 均匀 照度 ， 需 要 
凶 ( 较 高 ) 绿 、 黄 ”| 高 频 
40 ~90 日 色 ， a ee 
和 伺 灯 ee 很 亮 , 3000 ~7000 高 发 热 多 ， 多 用 于 频 闪 照明 
( 较 高 ) 偏 蓝 
100 红 、 黄 、 60000 ~ 发 热 少 ， 发 光 强 度 高 ， 体 积 小 ， 响 应 速 
LED 灯 亮 一 般 




















(高 ) 绿 、 白 、 蓝 100000 度 快 ， 稳 定性 好 ， 可 做 成 多 种 形状 
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图 2.8 LED 灯 外 形 





2.1.3 光源 类 型 


(1) 均匀 背景 光源 

用 钠 光 灯 或 LED 制 成 的 发 光 均 匀 的 面 光源 ， 如 图 2.9 所 示 。 在 视觉 测量 应 用 中 从 背面 
照射 ， 用 来 形成 不 透明 物体 的 阴影 或 观察 物体 内 部 。 均 匀 背 景 光源 主要 应 用 于 尺寸 测量 或 透 
明 物 体 的 缺陷 检测 。 














图 2.9 均匀 背景 光源 








(2) 穹 形 光源 

穹 形 光 源 (Dome Light) 通过 把 LED 的 发 光 集 中 到 球 心 上 ， 在 球 心 位 置 附近 形成 明亮 的 
立体 视觉 效果 ， 是 最 常用 的 照明 方式 ， 其 均匀 性 和 稳定 性 非常 突出 ， 如 图 2. 10 所 示 。 适 用 
于 透明 物体 内 部 或 立体 物体 的 表面 检测 ， 如 玻璃 瓶 、 滚 珠 、 小 工件 表面 等 。 还 适用 于 工作 上 距 
离 大 于 20mm 的 物体 的 照明 应 用 ， 如 印 制 字符 检测 ，PCB 元 器 件 、 塑 料 或 铝 制 容器 、 标 签 、 
工件 测量 等 。 

(3) 环形 光源 

环形 光源 (Ring Light) 采用 LED 按 圆周 排列 。 光 源 尺 寸 和 光线 角度 等 的 选择 直接 依赖 














图 2.10 容 形 光源 








于 被 测 工 件 的 光学 性 质 。 环 形 光 源 有 两 种 照明 方式 : 一 种 是 光线 直接 指向 目标 物体 ， 光 线 与 
光 轴 近似 平行 ， 如 交通 电子 眼 摄像 机 ; 男 一 种 发 出 的 光线 
向 内 汇聚 ， 光 线 方向 和 摄像 机 观察 方向 垂直 或 接近 90"。 光 摄像 机 
源 发 出 的 光 不 直接 进入 摄像 机 ， 瑕 症 等 表面 变化 引起 的 光 
线 改 变 方 向 进入 镜头 ， 从 而 实现 高 对 比 度 ， 如 上 暗 场 (Dark 
Field) 照明 均 是 用 此 类 光源 实现 的 。 
环形 光源 多 用 于 金属 工件 刻印 字符 、 光 滑 表 面 划 痕 、 
瓶 口 尺寸 或 裂纹 、 平 面 工 件 表 面 质量 检测 等 。 
(4) 同 轴 光源 
同 轴 光 源 是 指 照明 光线 平行 且 与 镜头 同 轴 ， 如 图 2. 11 
所 示 。 
从 同 轴 光 源 的 光路 图 中 可 以 看 出 ，LED 的 高 亮度 均匀 本 
光线 通过 半 透 半 反 射 镜 后 成 为 与 镜头 同 轴 的 光线 。 同 时 同 图 2.11 同 轴 光 源 
轴 光 的 光源 位 于 照明 光路 的 侧面 ， 这 样 的 照明 方式 可 以 减 
少 光 路 的 复杂 性 ， 避 免 光 源 的 放置 带 来 不 必要 的 麻烦 。 
同 轴 光 源 多 用 于 均匀 照射 具有 反射 性 的 工作 界面 。 观 察 完 全 平面 和 反光 的 样品 得 到 网 像 
是 对 来 自 镜头 照明 光线 的 真实 反射 。 


2.1.4 照明 方式 


光源 的 照明 方式 是 指 采 用 各 种 不 同类 型 的 光源 ， 对 被 测 物 进行 照明 的 光源 布置 类 型 和 过 
程 。 各 种 照明 方式 及 说 明 如 图 2. 12 所 示 。 






























































用 于 检测 平坦 的 、 交 滑 的 表面 绞 深 的 
特征 ， 消 除 阴 
镜头 和 摄像 机 
用 于 大 多 数 视 觉 照明 场合 
同 轴 光 照明 
个 亏 染 、 、 的 昌 
a A 用 于 检测 表面 和 染 、 划 人 和 小 的 起 
对 象 瞳 场 照明 
用 于 检查 透明 物体 的 透 过 率 和 不 透明 
WE 物 放 人 末 庆 设 曙 册 晤 
图 2.12 名 种 照明 方式 及 说 明 
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1. 直接 照明 和 间接 照明 

通常 机 器 视觉 照明 系统 中 ， 照 明 方式 大 体 可 以 分 为 直接 照明 和 间接 照明 。 

(1) 直接 照明 

如 图 2. 13 所 示 ， 直 接 照明 是 机 器 视觉 中 最 常用 的 照明 技术 ， 如 点 光源 照明 和 采用 穹顶 
光源 的 完全 明 场 照明 。 点 光源 照明 定向 性 好 ， 能 够 产生 高 度 反差 ， 增 强 表面 细节 。 但 是 对 于 
光滑 的 表面 ， 容 易 形 成 亮点 反射 ， 不 利于 检测 ， 所 以 一 般 用 于 粗糙 表面 。 完 全 明 场 照明 光照 

勺 ， 不 产生 明显 的 反射 亮点 
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2.13 直接 照明 示意 及 效果 





(2) 间接 照明 
间接 照明 是 与 直接 照明 相对 的 ， 采 用 暗 场 照明 、 散 射 等 照明 方式 的 照明 技术 ， 如 图 
2. 14 所 示 。 
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2.14 直接 照明 与 间接 照明 效果 对 比 
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2. 前 向 照明 与 背 向 照明 
通常 计算 机 视觉 系统 的 照明 系统 中 ， 照 明 方式 大 体 可 以 分 为 前 向 照明 和 背 向 照明 ， 如 图 


从 


Je 


图 2.15 前 向 照明 和 背 向 照明 对 比 示意 医 








(1) 前 向 照明 

前 向 照明 即 光 源 和 摄像 机 位 于 被 测 零件 的 同一 侧 ， 安 装 较为 方便 。 实 际 应 用 中 大 部 分 采 
用 前 向 照明 。 光 源 和 被 测 物 表面 之 间 可 以 成 一 定 的 角度 。 主 要 照射 物体 表面 的 重要 细节 特 
征 、 缺 陷 、 划 痕 等 。 

在 前 向 照明 又 分 为 低 角 度 照 明 (25° 以 下 ) 和 高 角度 照明 (75" 以 上 ) ， 其 区 别 在 于 光源 
发 射 的 光线 与 被 测 物 待 测 表面 的 夹 角 不 同 ， 如 图 2. 16 所 示 。 考 虑 是 使 用 高 角度 照明 还 是 使 
用 低 角度 照明 时 ， 要 根据 被 测 物 表面 待 测 部 分 的 机 理 不 同 进 行 选 择 。 同 轴 光 照明 也 属于 前 向 
照明 。 
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图 2.16 高 角度 照明 与 低 角度 照明 效果 比较 
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(2) 背 向 照明 
背 向 照明 是 将 光源 置 于 物体 的 后 面 ， 即 物体 在 摄像 机 和 光源 的 中 间 ， 如 图 2.17 所 示 。 
背 向 照明 有 两 个 作用 ， 其 一 是 突出 不 透明 物体 的 阴影 ， 获 得 高 对 比 度 的 图 像 。 这 种 作用 能 
很 好 地 将 被 测 物 的 边缘 轮廓 清晰 地 勾勒 出 来 ， 物 体 图 像 边缘 突出 。 背 向 照明 获得 的 图 像 分 析 
的 不 是 反射 光 而 是 透射 光 。 被 测 物 所 谈 挡 的 部 分 为 黑色 ,未 被 谈 挡 的 部 分 为 白色 ， 因 此 形成 
黑白 分 明 、 易 于 分 析 的 图 像 。 背 向 照明 观察 不 到 物体 的 表面 细节 。 


效果 
i ek 
Ws | hl 


人 
图 2.17 背 向 照明 示意 及 效果 
这 种 照明 方式 90% 用 于 精密 测量 系统 中 。 如 果 条 件 不 允许 ， 可 以 用 同 轴 光照 明代 替 。 
相同 条 件 下 ， 同 轴 光 照明 效果 不 如 被 光照 明 ， 所 以 对 于 尺寸 测量 ， 首 先 考 虑 背光 照明 。 
背 向 照明 的 另 一 个 作用 是 观察 透明 物体 的 内 部 。 
背 向 照明 中 的 散射 与 准 直 效 果 比 较 如 图 2. 18 所 示 。 
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图 2.18 背 向 照明 中 的 散射 与 准 直 效果 比较 
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3. 明 场 照明 和 有 瞳 场 照明 

(1) 明 场 照明 

明 场 照明 又 称 明 视野 照明 ， 是 指 用 直射 光 观 察 对 象 整体 ( 见 图 2. 19 ) ， 直 射 光 为 白光 。 
摄像 机 镜头 收集 到 的 光 是 物体 的 反射 光 。 

前 向 照明 中 的 同 轴 光 照明 、 高 角度 照明 都 属于 明 场 照明 。 明 场 照明 可 以 用 来 检测 平面 
的 、 表 面 光 滑 的 物体 ， 能 够 清楚 显现 表面 特征 或 减少 阴影 。 

(2) 上 暗 场 照明 

暗 场 照明 又 称 暗 视野 照明 ， 是 指 用 散射 光 来 观察 对 象 整 体 ， 散 射 光 呈 黑色 ， 如 图 2. 20 
所 示 。 摄 像 机 收集 到 的 光 是 物体 的 散射 光 。 
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图 2. 19 直射 光照 明 方式 图 2.20 暗 场 照明 示意 及 效果 




















前 向 照明 中 的 低 角度 照明 属于 瞳 场 照 明 。 暗 场 照 明 被 用 于 检测 表面 污 拆 和 表面 凸 起 的 特 





全 。 

















暗 场 照明 与 明 场 照明 的 效果 对 比如 图 2. 21 所 示 。 

4. 同 轴 照 明 、 平 行 光照 明 与 散射 照明 

(1) 同 轴 照 明 

常用 同 轴 光 源 的 光 直 接 照射 到 分 光 镜 上 ， 分 光 镜 把 光线 反射 到 物体 上 ， 从 物体 反射 回来 
的 光线 与 摄像 头 同 轴 ， 如 图 2. 22 所 示 。 同 轴 照 明 对 于 观察 非常 平整 或 抛光 的 表面 非常 理想 ， 
能 够 加 强 有 差异 角度 的 表面 特征 ， 增 强 表面 纹理 ， 减 少 阴 影 。 同 轴 照 明 主要 用 于 金属 玻璃 等 
光 洗 表面 的 划 痕 或 瑕 症 检 测 ， 忆 片 和 硅 片 的 破损 检测 ， 以 及 PC 模板 等 的 检测 。 

(2) 平行 光照 明 与 散射 光照 明 

在 计算 机 视觉 系统 中 ， 经 常会 碰 到 圆柱 形 检测 目标 ， 例 如 啤酒 瓶 、 电 池 壳 、 钢 管 、 易 拉 
芽 、 轴 、 和 香烟、 电子 元 件 、 铅 笔 等 ， 也 会 遇 到 其 他 曲面 (如 球面 ) 或 其 他 不 规则 形状 。 在 
照明 时 ， 这 些 曲面 有 一 个 共同 的 特点 ， 那 就 是 会 产生 反射 光 ， 会 影响 检测 方法 的 稳定 性 。 而 
且 对 于 曲面 上 的 文字 或 特征 进行 处 理 时 ， 图 像 的 视差 和 畸变 会 对 处 理 方法 提出 特殊 的 要 求 。 

根据 几何 光学 基本 定律 : 光线 的 反射 角 等 于 入射 角 ， 由 于 柱 面 的 法 线 是 连续 变化 的 ， 对 
于 很 多 入 射 角度 的 光线 ， 会 因为 光线 反射 到 摄像 机 镜头 而 产生 反光 亮点 或 斑 。 不 论 照明 光源 
的 角度 如 何 调整 ， 总 有 部 分 光线 反射 到 镜头 内 。 检 测 希 望 能 够 使 表面 特征 散射 的 光线 进入 镜 
头 成 像 ， 避 开 直 接 反 射 的 光线 ， 从 而 提高 对 比 度 ， 并 且 得 到 均匀 的 照明 图 像 。 对 上 述 问题 的 
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图 2.21 有 瞳 场 照明 与 明 场 照明 的 效果 对 比 
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图 2.22 同 轴 照 明示 意 及 效果 

解决 可 以 采用 平行 光照 明和 散射 光照 明 方式 ( 见 图 2.23)。 
1) 平行 光照 明治 轴 向 使 用 平行 光照 明 ， 适 当 控制 光线 的 入 射 角 ， 使 反射 不 能 直接 进 
入 镜头 ， 而 是 被 柱 面 反射 到 其 他 方向 。 一 般 情况 下 入 射 角 不 能 小 于 45"。 大 多 数 应 用 中 ， 需 
要 两 个 光源 ， 碳 边 的 光源 照明 左 半 部 分 ， 左 边 的 光源 照明 右 半 部 分 ， 中 间 有 一 定 的 重 礁 ， 这 
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样 可 同时 保证 照明 的 均匀 性 。 对 于 较 小 的 目标 ， 只 用 一 个 光源 就 能 满足 要 求 ， 只 是 照明 的 均 


匀 程 度 不 如 两 个 光源 对 射 的 效果 好 。 近 似 平行 光 沿 轴 方 向 以 一 定 角度 入 射 ， 使 反射 光 不 能 进 
入 镜头 ， 只 有 缺陷 或 被 测 特征 引起 的 散射 光 进 入 镜头 成 像 。 








图 2.23 平行 光照 明和 散射 光照 明 
2) 散射 光照 明 ”使 用 散射 照明 ， 也 叫 漫 散光 照明 ， 如 图 2. 24 所 示 。 其 基本 原理 是 如 果 
能 够 使 各 个 方向 进入 镜头 的 反射 光 均 匀 ， 那 么 反射 光 引起 的 反射 斑 就 被 消除 了 。 即 如 果 照 明 
光线 以 球状 分 布 从 各 个 方向 均匀 入 射 ， 那 么 不 管 从 哪个 方向 观察 ， 接 收 到 的 光线 是 一 样 多 
的 ， 亮 度 是 均匀 的 ， 也 不 产生 反射 斑 。 对 于 柱状 物体 ， 要 求 光 源 的 发 光 面 同样 是 柱 面 的 ， 发 
出 均匀 的 漫 射 光 ， 而 且 与 被 测 物 共 轴 。 用 于 曲面 ， 光 滑 表 面 检测 ， 与 在 阴 天 光线 照明 的 效果 
相似 ， 照 度 均匀 ,减少 眩光 。 
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图 2.24 散射 照明 示意 及 效果 

光源 设计 和 制造 比较 麻烦 。 散 射 照明 方法 产生 的 图 像 对 比 度 比 第 一 种 方法 低 ， 因 为 尽管 
反射 光 是 均匀 的 ， 但 这 些 光 线 还 是 直接 经 表面 反射 进入 镜头 成 像 。 而 第 一 种 方法 只 有 缺陷 产 
生 的 散射 光 进 入 镜头 参与 成 像 。 

不 同 颜色 的 光照 射 不 同 颜色 的 物体 ， 在 图 像 中 会 产生 不 同 的 效果 。 补 色 指 完全 不 含 另 一 
种 颜色 ， 红 和 绿 混合 成 黄色 ， 因 为 完全 不 含 蓝 色 ， 所 以 黄色 就 是 蓝 色 的 补 色 。 两 个 等 量 补 色 
混合 可 形成 白色 ， 红 色 与 绿色 经 过 一 定 比 例 混 合 就 是 黄色 ， 所 以 黄色 不 能 称 之 为 三 原色 。 

颜料 的 三 原色 就 是 能 够 吸收 RGB 的 颜色 ， 为 青 、 品 、 黄 ， 即 RGB 的 补 色 ， 如 图 2. 25 
所 示 。 把 黄色 颜料 和 青色 颜料 混合 起 来 ， 因 为 黄色 颜色 吸收 蓝光 ， 青 色 颜 料 吸收 红 光 ， 因 此 
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只 有 绿色 光 反 射出 来 。 
光 的 三 原色 (加 色 法 三 原色 ) 色彩 的 三 原色 ( 减 色 法 三 原色 ) 
R 红 C 青绿 
G 绿 M 赤 紫 
B 蓝 Y 黄色 








图 2.25 光 的 三 原色 与 色彩 的 三 原色 示意 图 


暖色 一 红 、 权 、 黄 多 a 


冷色 一 绿 、 蓝 、 紫 





人 眼 视 觉 


计算 机 视觉 





660nm ( 红 光 ) 白光 520nm ( 绿 光 ) 


图 2.26 暖色 与 冷色 的 反射 
如 图 2. 26 所 示 ， 使 用 相同 色调 的 光 可 以 使 被 照射 部 分 变 亮 〈 浅 ) 。 使 用 在 色 盘 中 直接 
相对 的 光 可 以 使 对 比 度 最 大 。 颜 色 反 射 对 照 见 表 2.2。 不 同 颜色 光 的 照明 效果 如 图 2.27 所 
示 。 不 同 波长 光照 明 效 果 如 图 2. 28 所 示 。 
表 2.2 颜色 反射 对 照 


























颜色 红 录 监 
纪 变 浅 变 深 变 深 
楼 变 浅 变 深 
黄 变 浅 变 浅 变 深 
绿 变 深 变 浅 变 深 

青绿 变 深 变 浅 变 浅 
蓝 变 深 变 深 变 浅 

品 红 变 浅 变 深 变 浅 
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红 光 下 绿 光 下 蓝光 下 


图 2.27 不 同 颜色 光 的 照明 效果 





470nm 蓝 色 可 见 光 





图 2.28 不 同 波长 光 的 照明 效果 
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2.2 固态 摄像 机 


2.2.1 固态 摄像 机 简介 


固态 摄像 机 的 图 像 传感器 是 一 种 全 固化 器 件 ， 其 光敏 单元 依据 光电 效应 原理 将 光 辐 射 的 
能 量 转换 为 电信 号 。 这 些 光 敏 单元 与 摄像 机 物镜 结合 ， 即 构成 固态 摄像 机 。 固 态 摄像 机 的 光 
敏 器 件 ， 主 要 有 以 下 类 型 : 

1) 电荷 耦合 器 件 (CCD)。 有 线 阵 扫描 CCD 和 面 阵 扫描 CCD 两 种 结构 。 还 有 互补 性 金 
属 氧 化 物 半导体 〈Complementary Metal-oxidesemiconductor，CMOS) ， 又 称 自 扫描 光敏 二 极 管 
阵列 。 

2) 电荷 注入 需 件 〈Charge Injection Device，CID ) 。 

3) 位 置 传 感 探 测 器 (Position Sensitive Detector ，PSD ) 。 

上 述 光 敏 器 件 都 是 感光 半导体 器 件 ， 即 利用 光敏 半导体 器 件 进行 光 与 电 的 转换 。 其 中 ， 
基于 CCD 的 各 种 摄像 设备 使 用 最 为 广泛 。 固 态 摄像 机 具有 以 下 明显 特点 : 

1) 全 固体 化 、 体 积 小 、 重 量 轻 、 不 受 电磁 现象 干扰 。 

2) 像 元 几何 位 置 精度 高 且 不 会 变动 。 

3) 可 选取 不 同 的 固态 图 像 传感器 ， 以 探测 不 同 波长 的 发 光 物 体 。 

1. 固态 摄像 机 性 能 指标 

1) 影像 传感器 〈 世 片 ) 对 角 线 尺寸 及 相应 面积 ; 

2) 横向 和 竖 向 像素 数 ; 

3) 模拟 信号 的 传输 频率 ; 

4) 视频 信号 的 传输 制式 (NTSC 、PAL ) ; 

5) 最 低 照度 要 求 ; 

6) 可 用 物镜 型 号 ; 

7) 电源 电压 ; 

8) 作业 湿度 与 温度 ; 

9) 功 耗 及 外 形 尺寸 、 重 量 等 。 

2. 固态 摄像 机 的 色彩 生成 方法 

固态 摄像 机 的 色彩 生成 方法 主要 有 两 种 : 

1) 在 图 像 传感器 前 放置 一 个 旋转 的 彩色 滤波 轮 ， 用 滤波 轮 上 的 滤 光 片 生成 红 - 绿 - 蓝 或 
青 - 品 红 - 黄 三 种 标准 光谱 带 的 图 像 ， 或 使 用 三 个 有 固定 滤 光 片 的 CCD 芯片 。 

2) 利用 传感器 世 片 各 传 感 元 所 敏感 的 波段 。 

3. 固态 摄像 机 一 般 结构 组 成 

如 图 2. 29 所 示 ， 在 物镜 1 与 传感器 芯片 5 之 间 布 置 了 几 个 光学 元 件 。 红 外 滤 光 片 2 用 
于 滤 去 波长 大 于 700nm 的 光波 ， 这 样 摄像 机 所 摄 图 像 大 体 与 人 眼光 谱 范 围 及 一 般 彩 色 感 光 
片 的 光谱 范围 一 致 。 漫 射 镜 片 3 多 为 一 个 双 折 射 石 英 板 ， 起 低 通 滤波 作用 。 这 些 是 行 间 传输 
方式 的 大 多 数 摄像 机 所 必需 的 部 件 。 行 间 传 输 方 式 的 CCD 多 使 用 电子 快门 。 玻 璃 保护 片 4 
用 以 保护 传感器 芯片 5。 一 般 来 说 在 设计 物镜 1 时 ， 并 未 综合 考虑 红外 滤 光 片 2 和 漫 射 镜片 
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3 的 影响 ， 因 而 降低 了 摄像 机 的 整体 性 能 。 1 i 4 
4. 视频 信号 的 传输 制式 10 
(1) 彩色 电视 制式 
1) NTSC ( National Television System 

Committee， 美 国 国家 电视 标准 委员 会 ) 制 





式 ， 主要 应 用 于 南美 洲 、 北 美洲 和 日 本 ， 9 
摄像 频率 为 60OHz，525 行 ， 隔 行 扫描 方式 。 

2) PAL (了 Phase Alternation Line， 相 位 567 8 
交 蔡 行 ) 制式 ， 主 要 应 用 于 欧洲 和 我 国 。 图 2. 29 ”固态 摄像 机 一 般 结构 组 成 

3) SECAM (色彩 顺序 传送 与 存储 ) 制 1 一 物镜 “2 一 红外 滤 光 片 ”3 一 漫 射 镜片 ”4 一 玻璃 
式 ， 主 要 应 用 于 法 国 。 保护 片 ”5 一 传感器 芯片 ”6 一 陶瓷 衬 底 7 一 插 接 件 


4) EIA (了 Electronics Industry Associa- 3 电子 部 分 9 电源 如 一 信 了 


tion， 电 子 工业 协会 ) 制式 。 

(2) 黑白 电视 制式 

1) RS-170 制式 ， 属 NTSC 制式 ,主要 应 用 在 南美 洲 、 北 美洲 和 日 本 , 场 (Field) 频率 
为 60Hz, 行 频率 为 15750Hz，525 行 ， 隔 行 扫描 方式 。 

2) CCIR (Consultive Committee of International Radio， 国 际 无 线 电 咨 询 委员 会 ) 制式 ， 
主要 应 用 于 欧洲 ， 场 频率 为 50Hz， 行 频率 为 15625Hz，625 行 ， 隔 行 扫描 方式 。 

3) RS-330 制式 ， 用 于 光栅 扫描 系统 的 标准 格式 ， 非 隔行 扫描 。 


2. 2.2 ”摄影 光学 系统 


摄影 光学 系统 是 将 空间 物体 成 像 于 感光 胶片 或 图 像 传感器 上 的 光学 系统 ， 也 称 摄影 物 
镜 。 当 采用 胶片 摄影 时 ， 底 片上 的 感光 乳胶 感受 光 的 作用 获得 潜 像 ， 经 化 学 处 理 后 即 可 以 显 
示 出 与 所 摄 物体 明暗 相反 的 像 ， 称 为 负 像 或 负片 。CCD 摄像 机 与 数码 相机 以 图 像 传 感 器 取 
代 了 感光 胶片 ， 摄 影 物镜 的 成 像 原理 与 胶片 摄影 是 一 致 的 ， 其 所 获得 的 是 空间 物体 的 图 像 。 

(1) 摄影 光学 系统 性 能 参数 

摄影 光学 系统 的 基本 光学 性 能 由 焦距 、 相 对 孔径 和 视 场 角 三 个 特征 参数 捅 述 。 

当 物 在 无 穷 远 时 ， 有 




















y’ = 一 tan 于 (2.1) 
由 式 (2.1) 可 见 ， 物 镜 的 焦距 决定 拍摄 图 像 的 大 小 。 
当 物 在 有 限 远 时 ， 有 
) =By =- (f/x)y (2.2) 
由 式 (2.2) 可 见 ， 当 视角 下 或 焦距 x 一 定时 , 像 的 大 小 y' 与 焦距 成 正比 。 
摄影 物镜 因 其 用 途 不 同 ， 其 焦距 变化 范围 很 大 ， 有 短 到 十 儿 毫 米 的 ， 也 有 一 米 以 上 的 。 
一 般 照 相机 上 应 用 的 物镜 ， 焦 距 在 二 十 几 毫 米 到 儿 百 毫米 之 间 。 
像 面 上 像 元 的 光照 度 为 











_ KL (20) B, 
4 \f'’ (B,-B) 
式 (2.3) 中 的 入 瞳 直 径 与 焦距 之 比 2a/f ' 称 为 相对 孔径 。 它 是 摄影 系统 的 重要 性 能 参数 。 
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像 的 光照 度 除 与 相对 孔径 的 二 次 方 成 比例 ， 相 对 孔径 反映 了 物镜 的 光 特 性 ， 它 与 透 过 率 天 
的 乘积 客观 地 反应 了 物镜 的 光 特 征 。 随 相对 孔径 的 不 同 ， 摄 影 物镜 有 弱 光 、 普 通 、 强 光 、 超 
强 光 之 分 。 普 通 镜头 的 相对 孔径 大 约 为 1/6.3 ~ 1/3.5， 而 超 强 光 镜 头 的 相对 孔径 大 到 1: 1 ， 
甚至 更 大 。 

摄影 物镜 的 视 场 角 决 定 了 摄 入 底片 或 图 像 传 感 器 的 空间 范围 。 任 何 摄影 设备 ， 视 场 光 盖 
的 片 框 都 有 固定 大 小 。 当 配 用 不 同 焦距 的 物镜 时 ， 对 应 的 视 场 角 2 丈 可 由 式 (2.1) 计算 。 
式 中 ，y "为 画幅 对 角 线 的 1/2。 可 见长 焦距 物镜 只 能 有 较 小 的 视 场 角 ， 能 对 远 处 物体 拍摄 得 
比较 大 的 像 ， 适 合 于 远 距 离 摄 影 ， 故 常 称 之 为 望远镜 头 或 远 摄 镜头 。 而 短 焦距 的 物镜 则 有 较 
大 的 视 场 角 ， 能 将 较 大 范围 内 的 景物 摄 和 人 底片 或 传感器 ， 故 称 之 为 广角 镜头 。 介 于 两 者 之 
间 ， 焦 距 约 等 于 画幅 对 角 线 长 度 的 物镜 称 为 标准 镜头 。 现 在 变焦 距 物 镜 已 得 到 广泛 应 用 ， 可 
以 取代 不 同 焦距 的 定 焦 镜头 。 

决定 摄影 物镜 性 能 的 三 个 参数 之 间 ， 有 着 相互 制约 的 关系 。 这 主要 反映 在 像 差 的 校正 
上 。 一 方面 ， 对 于 一 定 的 相对 孔径 和 视 场 角 ， 像 差 与 焦距 成 正比 ， 但 像 差 的 容 限 并 不 因 焦 距 
的 增 大 而 放宽 ,使 得 长 焦距 物镜 只 能 有 较 小 的 相对 孔径 。 男 一 方面 ， 相 对 孔径 大 时 要 控制 好 
宽 光 束 像 差 非常 困难 ， 再 要 达到 大 视 场 就 更 困难 了 。 这 就 是 说 ， 要 设计 一 个 兼顾 大 孔径 大 视 
场 角 的 优良 结果 是 极其 困难 的 。 实 际 上 ， 常 根据 物镜 的 具体 用 途 满足 其 主要 的 性 能 指标 ， 即 
强 光 镜头 只 能 有 较 小 的 视 场 ， 而 广角 镜头 只 能 选 较 小 的 孔径 。 

(2) 摄影 光学 系统 中 光束 的 限制 

在 摄影 物镜 中 ， 设 有 专门 的 孔径 光 益 ， 它 限制 进入 物镜 的 光 通 量 ， 决 定 像 的 照度 。 为 了 
使 同一 物镜 能 适应 各 种 光照 条 件 以 控制 像 面 获得 适当 的 照度 ， 和 孔径 光 益 都 采用 大 小 可 连续 变 
化 的 可 变 光 病 ， 从 而 获得 多 种 相对 孔径 以 供 选用 ， 并 在 物镜 的 外 过 上 标 出 各 档 相 对 孔径 的 位 
置 刻 线 及 其 倒数 ， 称 光圈 数 或 F 数 。 由 于 像 的 照度 与 相对 孔径 二 次 方 成 比例 ， 镜 关中 所 标 
出 的 各 档 数 是 以 2 为 公 比 的 等 比 级 数 。 根 据 国家 标准 ，F 数 按 如 下 数值 给 出 : 

F 数 1 1.4 2 2.8 4 5.6 8 11 16 22 32 

底片 上 的 照度 与 曝光 时 间 的 乘积 称 曝光 量 。 它 由 镜头 的 下 数 和 曝光 时 间 所 决定 。F 数 按 
以 上 形式 排列 时 ， 正 好 使 相 邻 两 档 在 曝光 量 上 相差 一 倍 (曝光 时 间 相 同时 )。 摄 影 时 ， 为 使 
底片 正确 曝光 ， 即 使 所 摄影 像 具 有 与 景物 明暗 程度 相对 应 的 光学 密度 ， 以 显示 出 影像 的 明暗 
层次 ， 应 根据 底片 的 感光 度 ， 正 确 控制 曝光 量 。 同 时 ， 根 据 景物 条 件 ， 有 时 需 首 先 确定 下 
数 〈 交 圈 优 先 ) ， 有 时 需 先 确 定 曝光 时 间 (快门 优先 ) ， 但 都 要 使 正 数 和 曝光 时 间 相 匹配 。 

摄影 物镜 中 ， 底 片 框 就 是 视 场 光 阑 。 由 于 相对 孔径 和 视 场 都 相对 较 大 ， 为 校正 各 种 像 
差 ， 物 镜 须 具有 相当 复杂 且 正 负 光 焦 度 分 离 的 结构 。 这 样 ， 为 了 减 小 物镜 的 体积 和 重量 ， 并 
拦截 那些 偏离 理想 光路 较 远 的 光线 ， 提 高 成 像 质 量 ， 常 有 意识 地 减 小 远 距 离 光 阑 的 透镜 直 
径 。 

(3) 摄影 光学 系统 的 景深 和 几何 焦 深 

在 摄影 时 ， 底 片上 拍摄 的 是 在 物镜 视 场 角 范围 内 的 纵深 空间 中 各 物体 的 像 。 当 把 物镜 调 
焦 于 某 一 摄影 对 象 时 ， 在 该 对 象 的 前 后 能 在 底片 上 清晰 成 像 的 范围 ， 称 为 景深 。 

将 入 瞳 直 径 2a 用 FF 数 取代 ， 得 到 适用 于 计算 摄影 物镜 景深 的 公式 为 
_ 六 2 
f°/F -pZ’ 





















































A! =p1-p (2.4) 
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p22’ 
~ f°/F -PP 

可 见 景深 与 物镜 的 焦距 、 光 圈 大 小 和 摄影 距离 有 关 。 光 圈 越 小 (FF 数 越 大 ) ， 或 摄影 距 
离 越 远 ， 景 深 越 大 。 但 远景 深度 要 比 近景 深度 大 。 若 在 同一 距离 用 同一 光圈 值 摄影 ， 则 焦距 
短 的 镜头 具有 大 的 景深 ,反之 长 焦距 的 镜头 的 景深 越 小 。 

由 于 在 使 用 同一 物镜 时 ， 景 深 随 光 圈 大 小 和 摄影 距离 而 变 ， 所 以 在 物镜 外 壳 上 ， 与 镜头 
调 焦 的 距离 刻度 相关 联 地 标 出 了 光圈 数 刻度 ， 以 粗略 指示 所 选 定 的 光圈 数 和 摄影 距离 的 景 
深 。 

严格 地 说 ， 一 个 像 面 只 与 一 个 物 面 对 应 。 当 拍摄 某 一 物 面 时 ， 要 通过 对 镜头 的 调 焦 ， 使 
之 清晰 成 像 于 底片 平面 上 。 但 因 眼 睛 分 辩 率 的 限制 而 存在 调 焦 不 准 ， 因 为 在 真正 的 像 面 前 后 
也 存在 一 个 貌似 清晰 的 深度 范围 。 这 一 在 像 空间 对 同一 物 面 都 成 清晰 像 的 范围 称 为 几何 焦 
深 。 

成 像 光束 与 像 面前 后 相距 A' 的 两 个 平面 相 截 的 弥散 圆 Z ， 如 果 小 到 被 眼睛 看 起 来 是 清 
晰 的 点 像 时 ， 则 2A' 即 为 几何 焦 深 ,有 


2A’' = 


A, =p-p; (2.5) 
































ZI 

tanU’ 
由 于 摄影 物镜 一 般 都 具 对 称 或 近 对 称 型 结构 ， 光 瞳 放 大 率 约 为 1， 因 此 可 认为 人 瞳 和 出 瞳 分 
别 与 物 方 主 面 和 像 方 主 面 重 合 ， 引 入 正 数 和 放大 率 B， 可 导出 





(2.6) 











24' = 22'F(1 -B) (2.7) 
当 对 准 平 面 位 于 无 穷 远 时 ， 几 何 焦 深 为 
24' = 22'F (2.8) 








可 见 ， 几 何 焦 深 与 下 数 有 关 ， 相 对 孔径 越 大 ， 几 何 焦 深 越 小 。 由 于 调 焦 不 准 导 致 的 接收 像 
面 上 的 弥散 圆 与 像 面 上 由 于 像 差 所 引起 的 弥散 斑 相 一 臻 ， 故 24' 可 作为 摄影 物镜 轴 向 像 差 的 
人 允 差 。 

(4) 摄影 物镜 的 分 辩 率 

摄影 物镜 的 分 辩 率 是 以 焦 面 上 每 毫米 中 能 分 辩 开 的 黑白 相间 的 条 纹 来 表征 的 。 根 据 对 无 
穷 远 两 点 可 能 被 理想 系统 分 辩 开 的 最 小 分 辨 角 公 式 ， 在 摄影 物镜 焦 平 面 上 能 分 辩 开 的 两 条 纹 
之 间 的 相应 间距 为 





1.22A 





5 = D7 (2.9) 

其 倒数 即 为 摄影 物镜 的 分 辨 率 。 当 和 =0. 00055 时 ， 有 
N= (2. 10) 

0 f 


可 见 摄 影 物镜 的 分 辩 率 与 相对 孔径 成 正比 。 式 (2.10) 决定 了 视 场 中 心 的 分 辨 率 ， 视 场 边 
缘由 于 成 像 光 束 的 孔径 角 比 轴 上 点 小 ， 分 辩 率 有 所 降低 。 实 际 的 摄影 物镜 总 有 较 大 的 剩余 像 
差 ， 其 分 辨 率 要 比 理想 分 辨 率 低 得 多 ， 而 视 场 边缘 受 轴 外 像 差 和 光束 渐 景 的 影响 ， 要 低 得 更 
多 。 因 此 分 辩 率 是 衡量 摄影 物镜 的 像 质 指标 之 一 。 

图 2. 30 所 示 是 两 种 检验 摄影 物镜 分 辩 率 的 图 案 ， 前 者 由 16 或 25 组 条 纹 宽度 不 等 的 相 
同 图 案 按 序列 排列 而 成 ， 各 组 又 以 条 纹 方向 不 同 的 四 个 小 方块 排列 起 来 ， 根 据 被 检测 的 物镜 
能 分 辨 开 的 最 密 一 组 条 纹 宽度 求 得 物镜 的 分 辨 率 。 后 者 是 一 个 条 纹 和 间隔 的 宽度 沿 径 向 方向 
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连续 变化 的 图 形 ， 根 据 它 被 物镜 所 成 的 像 中 分 辩 不 出 条 纹 的 模糊 直径 来 求知 其 分 辨 率 。 
检验 时 ， 分 辩 率 图 表 需 给 予 重 比 口 口 口 口 口 口 
充分 而 均匀 的 照明 。 测 试 方式 可 江川 口 口 口 口 口 口 
， 人 口 口 口 口 口 口 口 口 
以 是 直接 用 显微镜 观察 图案 由 物 pe 
镜 所 成 的 像 ， 获 得 物镜 的 日 视 分 口 口 口 口 口 口 口 口 
状 率 。 也 可 以 用 显微镜 来 观察 图 口 口 口 口 口 口 口 口 
案 被 物镜 所 拍摄 得 到 的 底片 得 口 口 口 口 硅 乡 三 多 
到 物镜 的 照相 分 辩 率 ， 显 然 ， 照 “ 口 口 口 口 沪 INISSH 
相 分 辩 率 由 被 摄影 物镜 的 分 辩 率 图 2.30 检验 摄影 物镜 分 辨 率 的 图 案 
和 底片 的 分 辩 率 共同 决定 。 一 般 照 相 分 辨 率 要 比 目 视 分 辨 率 低 得 多 。 物 镜 的 目 视 分 辩 率 N 、 
照相 分 辩 率 N, 与 底片 分 辩 率 N, 之 间 的 关系 如 下 : 
1 1 1 
N NAN 









































(2.11) 


(5) 摄影 物镜 

摄影 物镜 属 大 孔径 大 视 场 系统 ， 需 要 对 各 种 像 差 做 全 面 校正 。 但 由 于 其 光量 接收 融 一 一 
感光 乳胶 的 粒子 或 图 像 传 感 带 相对 较 粗 ， 对 像 差 的 要 求 要 比 目 视 光 学 系统 低 得 多 ， 属 大 像 差 
系统 。 

设计 摄影 物镜 时 ， 一 般 对 无 穷 远 物 面 校正 像 差 。 因 为 在 一 般 摄影 时 ， 拍 摄 距 离 总 要 比 物 
镜 的 焦距 大 得 多 。 对 于 只 对 有 限 远 物体 摄影 的 物镜 ， 应 按 最 常用 的 拍摄 距离 或 摄影 倍率 来 进 
行 设计 。 

摄影 物镜 随 相 对 孔径 和 视 场 的 大 小 而 不 同 ， 并 且 结 构 繁 多 。 只 要 结构 不 是 特别 不 合理 或 
过 于 简单 ， 七 种 初级 像 差 一 般 都 能 被 校正 到 目标 值 。 又 因为 各 种 形式 物镜 的 高 级 像 差 和 像 差 
特征 不 会 有 明显 变化 ， 所 以 要 从 高 级 像 差 出 发 来 选择 结构 ， 并 使 初级 像 差 和 高 级 像 差 合理 平 
衡 。 
2. 2.3 ”光学 镜头 的 一 般 知识 介绍 


摄像 机 的 光学 镜头 是 图 像 传感器 之 前 的 光学 成 像 装置 ， 能 够 控制 图 像 传感器 的 图 像 采集 
范围 ， 使 得 场景 中 的 光线 能 够 集中 进入 较 小 的 图 像 传 感 器 表面 ; 能 够 限制 光 通 量 ， 避 免 光 线 
直接 照射 传感器 造成 信号 饱和 而 无 法 分 辨 图 像 。 通 过 调节 镜头 的 焦距 、 光 圈 使 摄像 机 能 够 改 
变 图 像 的 视角 和 亮度 。 
1. 光学 镜头 的 性 能 指标 
光学 镜头 与 视觉 测量 有 关 的 主要 指标 包括 放大 倍率 、 视 场 (视角 ) 、 分 辨 率 、 景 深 等 因 
， 光 学 系统 成 像 示 意图 如 图 2. 31 所 示 。 
(1) 视 场 
整个 系统 能 够 观测 到 的 物体 的 物理 尺寸 范围 。 也 就 是 CCD 芯片 上 所 成 的 最 大 图 像 对 应 
的 物体 的 大 小 。 如 图 2. 32 所 示 ， 视 场 大 小 与 工作 距离 、 焦 距 、CCD 芯片 有 关 。 刀 表示 工作 
距离 ( 物 距 ), /为 焦距 。 一 般 来 说 ， 焦 距 越 大 ， 视 场 越 小 ， 图 像 的 细节 越 清晰 ， 焦距 越 小 ， 
视 场 越 大 ， 图 像 的 细节 起 模糊。 镜头 按 焦距 可 分 为 标准 镜头 、 广 角 镜 头 、 长 焦 镜 头 或 远 摄 镜 
头 、 变 焦 镜 头等 。 
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标准 镜头 : 视角 30" 左 右 ， 焦 
距 定 位 为 12mm， 也 可 称 中 焦距 锐 
头 。 

广角 镜头 : 视角 90" 左 右 ， 焦 
距 小 于 几 毫 米 ， 可 以 提供 宽广 的 视 
场 ， 也 可 称 短 焦 镜 头 。 

远 摄 镜头 : 视角 20° 以 内 ， 焦 
距 为 几米 其 至 几 十 米 ， 可 以 拍摄 远 图 2.31 成 像 示意 
距离 的 物 像 ， 亦 称 长 焦 镜头 。 

变焦 镜头 : 介 于 标准 镜头 和 广角 镜头 之 间 ， 焦 距 连 续 可 变 ， 既 可 以 拍摄 远 距 离 物体 ， 又 
可 提供 宽广 视 场 。 






































(2) 放大 倍率 成 像 面 CCD 芯 片 
物体 的 像 的 大 小 与 物体 物理 尺寸 的 比值 ， 可 以 
表示 为 焦距 、 下 -一 一 
区 - 
M = FOV = 办 (2. 12) 


式 中 ，FOV 为 水 平视 场 ; 区 为 CCD 芯片 长 边 尺寸 。 
如 图 2. 33 所 示 ， 放 大 倍数 与 成 像 效 果 密 切 相关 。 
(3) 分 辩 率 
像 空 间 分 辨 率 为 CCD 分 辨 率 ， 即 两 个 像素 的 物 ww 


工作 距离 
理 尺寸 ; 物 空间 的 分 辨 率 可 以 理解 成 能 够 测量 的 最 
小 物体 尺寸 ， 有 

R _ 2P x FOV 


R, = py i (2. 13) 图 2.32 ”光学 镜头 示意 图 
式 中 ,PP 为 像 元 大 小 (pm) ; R 为 CCD 分辨 率 (pm); 工 为 CCD 芯片 成 像 部 分 长 边 (pm); 





图 像 传感器 图 像 传感器 图 像 传感器 





| | 1 
物 < < Ege “siee. 


放大 倍数 <1 放大 倍数 =1 放大 倍数 >1 
图 2. 33 ”镜头 放大 倍数 与 成 像 的 关系 示意 图 
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FOV 为 水 平视 场 (mm) ; 为 系统 放大 率 ; Ra 为 物体 的 分 辩 率 (hm) 。 
分 辩 率 对 成 像 的 影响 如 图 2. 34 所 示 。 
图 像 传感器 


无 法 分 辨 





图 2.34 ”分辩 率 对 成 像 的 影响 

(4) 景深 

CCD 能 清晰 成 像 的 距离 范围 ， 即 如 果 希 望 得 到 清晰 的 像 ， 物 距 不 能 取 任 意 值 ， 而 是 有 
一 定 的 范围 ， 超 出 这 个 范围 分辨 率 就 会 降低 。 景 深 与 光圈 、 焦 距 有 直接 关系 ， 景 深 随 着 光 
圈 和 焦距 的 减 小 而 增加 。 

(5) 与 测量 有 关 的 其 他 因素 

1) 调 焦 环 ”光学 镜头 一 般 有 一 个 调节 聚焦 环 ， 用 于 微调 镜头 和 传感器 之 间 的 距离 ， 使 
得 外 部 光线 能 够 准确 聚焦 到 传感器 成 像 平面 ， 从 而 在 传感器 上 获得 清晰 的 图 像 信 号 。 某 些 一 
体式 摄像 机 具有 自动 调 焦 功能 ， 能 够 通过 对 所 获 图 像 的 清晰 度 的 分 析 来 自动 调节 聚焦 。 

2) 快门 速度 ”决定 了 感光 器 件 的 曝光 时 间 ， 人 快门 速度 与 光圈 大 小 决定 了 感光 器 件 的 曝 
光量 。 

3) 光圈 通过 改变 光圈 孔径 的 大 小 ， 灵 活 控制 进入 传 感 絮 的 光 通 量 ， 从 而 改变 图 像 的 
亮度 和 对 比 度 。 镜 头 有 手动 光圈 和 自动 光圈 ， 配 合 摄像 机 使 用 ， 手 动 光 圈 镜 头 适合 于 亮度 不 
变 的 应 用 场合 。 当 亮度 变化 时 ， 自 动 光 圈 作 自动 调整 ， 适 用 于 亮度 变化 的 场合 。 

4) 摄像 机 镜头 的 规格 ”摄像 机 镜头 的 规格 应 视 摄像 机 的 CCD 尺寸 而 定 ， 两 者 应 相互 对 
应 。 如 摄像 机 的 CCD 靶 面 为 1/2in? 时 ， 镜头 应 选 1/2in, 1/3in 对 1/3in，1/4in 对 1/4in。 

5) 镜头 与 摄像 机 的 安装 接口 ”中 所 有 摄像 机 镜头 接口 均 是 螺纹 口 。@ 镜 头 安装 有 两 种 
工业 标准 ，C 安装 座 和 CS 安装 座 。C 安装 座 从 镜头 安装 基准 面 到 焦点 的 距离 为 17. 326mm。 
CS 安装 座 即 特种 C 安装 ， 镜 头 基 准 面 到 焦点 的 距离 是 12. 5mm， 即 将 摄像 机 前 部 的 垫圈 取 
下 再 安装 镜头 。 如 果 要 将 一 个 C 安装 座 镜头 安装 到 一 个 CS 安装 座 摄像 机 上 时 ， 需 要 使 用 镜 
头 转换 器 。 














OO lin =25.4mm。 
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2. 光学 系统 的 选择 

光学 镜头 是 视觉 测量 系统 的 关键 设备 ， 直 接 影响 到 摄像 机 的 整 机 指标 。 根 据 光 学 系统 的 
性 能 指标 ， 光 学 系统 的 选择 要 根据 以 下 指标 综合 考虑 。 

1) 光学 镜头 的 成 像 尺寸 应 与 摄像 机 图 像 传 感 絮 尺寸 一 致 ， 接 口 类 型 互相 匹配 。 

2) 要 确保 光学 镜头 具有 足够 的 分 辨 率 ， 摄 像 机 传感器 尺寸 越 小 ， 对 镜头 的 分 辨 率 要 求 
越 高 。 光 学 镜头 与 CCD 配合 ， 应 能 够 分 辨 测量 所 需 的 细节 ， 保 持 测量 的 精度 。 
3) 对 定 焦 镜头 和 变焦 镜头 来 讲 ， 同 一 档次 的 定 焦 镜头 的 像 差 肯定 比 变焦 镜头 的 小 。 这 
是 因为 变焦 镜头 必须 考虑 折 中 方案 ,使 得 各 种 不 同 焦距 下 的 成 像 质 量 都 相对 较 好 ， 不 允许 出 
现在 变焦 范围 内 某 个 焦距 的 成 像 很 差 的 情况 。 因 此 ， 图 像 测 量 应 用 系统 中 ， 根 据 被 测 目 标的 
状态 应 优先 选用 定 焦 镜头 。 

4) 对 于 光学 镜头 的 视野 和 景深 ,要 保持 在 工作 距离 内 目标 物 能 够 清晰 而 以 较 大 画幅 呈 
现在 图 像 当 中 。 

5) 对 于 光学 镜头 的 光圈 和 快门 ， 应 使 成 像 保 持 清晰 。 根 据 被 测 环境 的 光线 变化 程度 选 
择 使 用 手动 光圈 还 是 自动 光圈 。 

6) 考虑 畸变 误差 ， 选 择 畸 变 差 满足 测量 要 求 的 镜头 。 

在 图 像 测 量 中 ， 常 选用 物 方 远 心 镜头 ， 其 景深 大 、 焦 距 固定 、 畸 变 小 ， 可 获得 比较 高 的 
检测 精度 。 


2. 2.4 ”分 色 滤 光 片 


分 色 滤 光 片 位 于 光学 镜头 和 图 像 传感器 之 间或 与 图 像 传 感 器 整合 在 一 起 ， 当 摄像 机 中 不 
具备 分 色 滤 光 片 时 ， 传 感 器 输出 的 是 光照 强度 信号 ， 即 摄像 机 输出 的 是 黑白 图 像 。 为 了 使 图 
像 传感器 输出 彩色 信号， 必须 在 传感器 的 CCD 或 CMOS 前 方 加 装 滤 光 片 ， 以 使 该 单元 只 输 
出 特定 色彩 分 量 的 光 强 度 ， 这 样 摄像 机 就 可 输出 彩色 图 像 。 

常用 的 分 色 方 式 有 两 种 : 一 种 是 RGB 原色 分 色 法 。 男 一 种 是 CMYK 补 色 分 色 法 。 这 两 
种 方法 各 有 优 缺 点 。RGB 原色 分 色 法 又 称 三 原色 分 色 法 。 通 过 模拟 人 眼 颜 色 感 知 特性 ， 由 
红 、 绿 、 蓝 组 成 ， 彩 色 信息 就 是 由 这 三 原色 通道 互相 调节 合成 的 。CMYK 补 色 分 色 法 ， 由 四 
个 通道 的 颜色 配合 而 成 ， 分 别 是 青 (C) 、 品 红 (M) 、 黄 (Y) 、 黑 (K) 四 种 。 其 中 ，C 是 
G 和 B 的 补 色 ，M 是 R 和 B 的 补 色 , Y 是 R 和 G 的 补 色 ， 而 KK 则 代表 黑色 ， 用 于 补偿 补 色 
合成 黑色 的 不 足 。CMYK 适用 于 印刷 业 ， 其 调制 出 来 的 颜色 没有 RGB 调制 的 颜色 多 。 

原色 分 色 滤 光 摄 像 机 的 优势 在 于 画 质 锐 利 、 色 彩 真 实 。 其 缺点 在 于 色彩 分 量 噪声 干扰 较 
大 ， 一 般 需 采 用 ISO 感光 度 不 超过 400 的 原色 分 色 滤 光 摄 像 机 才能 克服 。 补 色 分 色 摄 像 机 多 
了 一 个 滤 色 器 ， 色 彩 分 辨 比较 细致 ， 但 牺牲 了 部 分 影像 的 分 辩 率 ， 在 ISO 感光 度 上 补 色 分 色 
摄像 机 感光 度 可 设 定 在 800 以 上 。 

单传 感 器 摄像 机 仅 有 一 片 传 感 器 芯片 ， 并 由 这 个 单一 的 传感器 芯片 进行 亮度 与 彩色 信和 号 
( 即 色 度 信号 ) 的 光电 转换 。 其 中 ， 色 度 信号 用 传感器 前 的 一 些 特定 的 分 色 滤 光 片 装置 并 结 
合 后 面 的 电路 完成 。 采 用 一 片 传 感 需 同时 完成 颜色 亮度 的 转换 ， 拍 摄 的 图 像 在 色彩 还 原 上 存 
在 一 定 缺陷 。 

多 传感器 摄像 机 是 一 台 摄 像 机 使 用 了 多 片 传感器 芯片 。 利 用 棱镜 分 光 原 理 将 彩色 光 分 
色 ， 然 后 投射 到 多 个 传感器 上 ， 再 通过 信和 号 处 理 电 路 将 多 个 传感器 获得 的 亮度 信号 合成 彩色 
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图 像 信号 。 与 单传 感 器 摄像 机 相 比 ， 多 传感器 拍摄 出 来 的 图 像 从 色彩 还 原 上 更 自然 ， 亮 度 与 
清晰 度 都 比 单传 感 器 好 ， 但 装置 结构 复杂 、 成 本 高 。 


2.3 图 像 传感器 


2.3.1 CCD 图 像 传 感 器 


1. 电荷 耦合 器 件 的 一 般 知 识 

电荷 耦合 器 件 (CCD) 是 一 种 半导体 器 件 ， 它 具有 光电 转换 的 功能 。 不 同 于 以 电流 或 
电压 作为 信号 的 其 他 大 多 数 器 件 ，CCD 是 以 电荷 为 信号 的 。 具 有 电荷 存储 与 移 位 功能 。CCD 
的 电荷 注入 方式 有 电 注 入 方式 和 光 注 入 方式 两 种 。 固 态 图 像 传 感 器 采用 的 是 光 注 入 方式 。 光 
照 后 收入 在 感光 单元 势 阱 中 的 电荷 包 的 大 小 ， 与 入 射 光 的 强 弱 成 正比 ， 从 而 将 光 信 号 转变 为 
电荷 信号 。CCD 实质 是 按 某 种 规律 排列 的 MOS (金属 氧化 物 半导体 ) 电容 器 阵列 构成 的 移 
位 存储 器 。MOS 具有 存储 和 转移 电荷 的 功能 。 

总 之 ， 利 用 CCD 的 光电 转换 功能 及 光学 成 像 系统 ， 就 构成 了 CCD 图 像 传 感 器 或 CCD 摄 
像 机 。CCD 的 工作 过 程 就 是 电荷 的 产生 、 存 储 、 转 移 和 检测 的 过 程 。 以 下 分 别 加 以 介绍 。 

(1) 光电 荷 的 产生 

CCD 的 首要 功能 是 完成 光电 转换 ， 即 产生 与 人 射 的 光谱 辐射 量 呈 线性 关系 的 光电 和 荷 。 
入 射 光 越 强 ， 产 生 的 光电 荷 量 越 大 。 

当 光 入 射 到 作为 光敏 面 的 CCD 硅 片上 时 ， 在 栅 极 附近 的 半导体 内 产生 电子 - 空 穴 对 ， 其 
多 数 载 流 子 被 栅 极 电压 排 开 ， 少 数 载 流 子 被 收集 在 势 阱 中 ， 便 产生 了 光电 和 荷 信号 。 

CCD 在 某 一 时 刻 所 获得 的 光电 和 荷 与 前 期 所 产生 的 光电 和 荷 累 加 ， 称 为 电荷 积分 。 和 人 射 光 
越 强 ， 一 定时 间 通 过 电荷 积分 所 得 到 的 光电 和 荷 量 越 大 ， 即 摄像 机 采样 间隔 内 得 到 的 电荷 量 越 
大 。 入 射 光 越 强 ， 获 得 同等 光电 和 所 需 的 积分 时 间 越 短 ， 可 视 为 摄像 机 采样 频率 越 高 。 

光 注 入 方式 分 正面 注入 式 和 背面 注 
入 式 。 正 面 照 射 时 光 注 入 示意 图 如 图 
2.35 所 示 ，CCD 器 件 的 光敏 单元 为 光 注 
入 方式 。 光 注入 电荷 为 

0 = ngAn, AT. (2. 14) 
式 中 ,7 为 材料 的 量子 效率 (单位 人 射 
光 强 度 ， 产 生 电 荷 的 效率 ) ; 9 为 电子 电 ul 
荷 量 ， 可 以 理解 为 带电 粒子 的 电荷 量 ; 图 2.35 正面 照射 式 光 注 入 示意 图 
An, 为 人 射 光 的 光子 流速 率 ， 可 以 理解 为 光照 强度 ; 4 为 光敏 单元 的 受 光 面积 ; 7. 为 光 注 入 
时 间 。 

当 CCD 确定 后 ，n、g、4 均 为 常数 ， 注 入 到 势 阱 中 的 电荷 0 与 人 射 光 的 光子 流速 率 
An, 与 注入 时 间 7, 成 正比 。 

注入 时 间 也 由 CCD 驱动 器 的 转移 脉冲 周期 7 决定 (可 以 理解 为 多 长 时 间 采 样 一 次 ) 。 

当 所 设计 驱动 器 能 够 保证 注入 时 间 稳 定 不 变 时 ， 注 入 CCD 势 阱 中 的 信号 电荷 只 与 人 射 
辐射 的 光子 流速 率 An, 成 正比 。 
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而 在 单 色光 入 射 辐射 时 ， 入 射 光 的 光子 流速 率 与 人 射 光谱 辐射 通 量 的 关系 为 
9 
Am = ee (2. 15) 
式 中 ,hh、v 都 是 常数 。 

光 注 入 电荷 量 与 人 射 光 谱 幅 通 量 号 成 线性 关系 。 该 线性 关系 是 应 用 CCD 检测 光谱 强度 
进行 多 通道 光谱 分 析 成 像 的 理论 基础 。 

(2) 电荷 存储 

CCD 的 基本 单元 是 由 金属 氧化 物 半导体 (MOS) 组 成 的 电容 器 ， 如 图 2. 36 所 示 。 

CCD 中 的 MOS 电容 器 的 形成 UG 
方法 : CCD 一 般 是 以 P 型 硅 为 衬 SR 
底 , 在 P 型 硅 衬 底 上 用 氧化 的 办 氧 t 物 ~ 全 人 Mh A EE 
法 生成 一 层 厚度 约 为 100 ~ 150nm “ 莱 Em 
的 Si0, 绝缘 层 ， 再 在 Si0, 表面 按 ] 

一 定 层次 沉淀 或 茸 镀 一 个 金属 电 一 =- 一 

极 ， 称 为 栅 极 。 在 衬 底 和 电极 间 加 图 2.36 CCD 单元 阵列 结构 示意 图 
上 一 个 偏 置 电压 ( 栅 极 电压 )， 即 

形成 了 一 个 MOS 电容 器 。 

在 这 种 了 型 硅 衬 底 中 ， 多 数 载 流 子 是 空 从 ， 少 数 载 流 子 是 电子 。 在 栅 极 施加 正 偏 压 之 
前 , P 型 硅 半 导体 中 多 数 载 流 子 空 穴 的 分 布 是 均匀 的 。 

当 在 栅 极 施加 小 于 了 型 硅 半 导体 的 阐 值 电压 的 正 偏 压 U 后， 空 穴 被 排斥 ， 产 生 耗 尽 
区 。 

当 偏 奈 继续 增加 ， 耗 尽 区 将 进一步 向 半导体 内 延伸 。 

当 栅 极 的 正 偏 压 大 于 了 型 硅 半 导体 的 阔 值 电压 时 ， 半 导体 与 绝缘 体 界面 上 的 电势 变 得 非 
常 高 ， 以 至 于 将 半导体 内 的 少数 载 流 子 电子 吸引 到 表面 ， 形 成 一 层 极 薄 的 但 电荷 浓度 很 高 的 
反 转 层 。 耗 尽 层 对 带 负 电荷 的 电子 而 言 是 一 个 势能 特别 低 的 区 域 ， 用 半导体 物理 中 的 “ 势 
阱 ”概念 描述 ， 如 图 2. 37 所 示 。 反 转 层 电荷 的 存在 表明 了 MOS 结构 存储 电荷 的 功能 。 

表面 势 与 反 转 层 电荷 的 浓度 具有 良好 的 反比 例 线性 关系 。 吸 引 电荷 相当 于 向 井 里 注水 。 
吸引 的 电荷 越 多 ， 表 面 势 缩小 。 耗 尽 层 缩小 。 相 当 于 势 阱 被 注入 后 容量 变 小 。 其 中 单个 像素 
所 能 存储 的 最 大 电荷 量 ， 称 为 满 阱 容量 。 

当 光 线 照射 MOS 表面 时 ， 半 导体 产生 电子 空 穴 对 ， 例 如 一 个 光子 产生 一 个 电子 空 穴 对 。 
电子 空 穴 对 中 ， 电 子 被 吸引 到 势 阱 中 存储 起 来 。 这 些 存储 的 电荷 与 MOS 所 受 的 入 射 光 强 成 
正比 。 

(3) 电荷 转移 二 ， 

当 完成 对 光敏 单元 阵列 的 扫描 后 ，CCD 4 让 
将 电荷 按 顺序 转移 读 出 。 通 过 按 一 定 的 时 序 
在 电极 上 施加 高 低 电 平 ， 可 使 电荷 在 相 邻 的 
势 阱 间 进 行 转移 。 通 常 把 CCD 的 电极 分 为 几 
组 ,每 一 组 为 一 相 ， 并 施加 同样 的 时 钟 脉 
冲 。 按 相 数 划 分 ，CCD 一 般 可 分 为 二 相 人 
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CCD、 三 相 CCD 及 四 相 CCD。 下 面 以 三 相 CCD 为 例 ， 介 绍 电荷 转移 过 程 。 
图 2. 38 为 三 相 CCD 中 的 4 个 彼此 相 邻 的 电极 的 情况 。 
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图 2.38 CCD (三 相 ) 中 电荷 的 转移 

如 图 2. 38a 所 示 初 始 时 刻 ， 电 荷 存 储 在 偏 压 为 10V 的 第 一 个 电极 下 面 的 势 阱 中 ， 其 他 电 
极 上 均 加 有 大 于 靖 值 的 较 低 电压 (2V) 。 

经 过 4 时 刻 后 ， 各 电极 上 的 电压 变 为 如 图 2. 38b 所 示 ， 第 一 个 电极 仍 保持 为 10V， 第 二 
个 电极 上 的 电压 由 2V 变 到 10V。 因 这 两 个 电极 靠 得 很 近 ， 间 隔 只 有 几 和 微米， 它们 各 自 的 对 
应 势 阱 将 合并 在 一 起 ， 原 来 在 第 一 个 电极 下 的 电荷 迅速 向 第 二 个 电极 转移 ， 因 而 变 为 两 个 电 
极 下 势 阱 所 共有 ， 如 图 2. 38c 所 示 。 

继续 改变 电极 电压 ， 第 一 个 电极 电压 由 10V 变 为 2V， 第 二 个 电极 电压 仍 为 10V， 则 共 
有 的 电荷 转移 到 第 二 个 电极 下 面 的 势 阱 中 ， 如 图 2. 38d、e 所 示 。 通 过 以 上 方法 ， 电 和 荷 及 势 
阱 向 右 移动 了 一 个 位 置 。 三 相 CCD 的 电荷 转移 必须 在 三 相 驱 动脉 冲 的 作用 下 才能 完成 ， 按 
一 定 的 方向 逐 单元 转移 。 图 2. 38f 所 示 为 三 相 驱 动脉 冲 的 波形 图 。 

(4) 电荷 输出 

电荷 的 输出 是 指 在 电荷 转移 通道 的 末端 ， 将 电荷 信号 转换 为 电压 或 电流 信和 号 输出 。 目 
前 ，CCD 的 输出 方式 主要 有 电流 输出 ， 浮 置 扩 散 放 大 器 输出 和 浮 置 顶 放 大 器 输出 。 















































变换 成 模拟 信号 之 后 再 离散 采样 、A-D 转换 才 转 换 成 每 个 像素 的 数字 量 。 

(5) 图 像 传感器 芯片 

它 是 图 像 传 感 单元 的 集成 器 件 ， 也 是 摄像 机 的 核心 器 件 ， 负 责 将 通过 滤 色 层 的 光 信 号 转 
换 成 电信 号 。 

衡量 图 像 传感器 芯片 的 技术 指标 包括 像素 数 、 尺 寸 、 灵 人 敏 度 和 信 噪 比 等 。 其 中 ， 像 素数 


和 尺寸 是 摄像 机 的 两 项 重要 指标 。 

像素 数 是 指 传感器 必 片 上 感光 单元 数目 。 摄 像 机 拍摄 的 画面 由 很 多 个 小 的 像素 组 成 。 理 
论 上 讲 , 传感器 的 像素 数 和 分 辨 率 之 间 密 切 相关 ， 像 素数 越 多 ， 拍 摄 的 图 像 就 会 越 清 晰 ， 如 
果 没 有 足够 的 像素 ， 哲 摄 的 画面 的 清晰 度 会 受到 很 大 的 影响 。 

传感器 蕊 片 是 传 感 单元 的 集合 体 。 在 像素 数 相同 的 情况 下 ， 传感器 尺寸 (一般 以 传 感 
器 芯片 对 角 线 长 度 表 示 ) 越 大 ， 可 以 收集 的 光线 越 多 。 理 论 上 说 可 以 扩大 视 场 并 提高 图 像 



































质量 。 
2. CCD 摄像 机 的 工作 原理 
CCD 摄像 机 和 图 像 采 集 卡 共同 完成 对 被 摄 物 体 图 像 的 采集 与 数字 化 。CCD 摄像 机 以 其 
体积 小 巧 、 性 能 可 靠 、 清晰 度 高 而 得 到 广泛 应 用 。CCD 摄像 机 由 光学 镜头 、 分 色 滤 光 片 、 
CCD 图 像 传感器 芯片 和 摄像 机 内 置 处 理 电路 组 成 。CCD 摄像 机 工作 原理 如 图 2. 39 所 示 。 
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图 2.39 CCD 摄像 机 工作 原理 

场景 景物 反射 的 外 来 光 或 本 身 所 发 射 光线 ， 通 过 镜头 光学 系统 在 CCD 图 像 传感器 的 误 
面 上 成 像 ， 由 CCD 图 像 传感器 完成 光电 转换 。 即 将 成 像 的 光 的 强度 信号 变 成 对 应 的 电信 号， 
经 内 置 处 理 电路 ， 变 换 成 摄像 机 输出 的 模拟 视频 信和 号 。 

在 外 加 工作 电压 (驱动 脉冲 电压 ) 的 驱动 下 ， 给 CCD 阵列 加 上 时 间 序 列 转移 信号 ， 像 
素 中 生成 的 电荷 就 会 一 行 行 高 速 输出 。 再 按照 一 定 的 规则 组 合 ， 就 会 生成 静止 的 光学 图 像 。 
CCD 图 像 传感器 具有 如 下 特点 。 

(1) 高 解析 度 

像素 大 小 为 pm 级 ， 每 个 像素 的 尺寸 约 为 0.008mm x 0. 008mm， 相 当 于 人 头发 丝 的 
1/10。 而 且 每 个 像素 都 是 相对 独立 的 光电 转换 单元 。 

(2) 高 灵敏 度 

能 探测 光 强 很 低 的 入 射 光 。 

(3) 动态 范围 宽 

不 会 因为 人 射 光 过 强 或 过 弱 而 导致 信号 出 现 很 大 的 反差 。 

(4) 光谱 响应 范围 宽 

能 探测 波长 范围 很 宽 的 光 ， 当 然 有 响应 最 强 的 波段 。 

3. 线 阵 CCD 图 像 传感器 

CCD 感光 单元 ( 即 MOS) 有 序 排列 成 一 线 的 传感器 称 作 线 阵 CCD 图 像 传 感 器 。 

为 测量 二 维 景物 ， 一 般 用 机 械 的 方法 ,使 被 摄 景物 与 线 阵 CCD 图 像 传 感 器 间 产 生 相 对 
移动 。 即 线 阵 CCD 摄像 机 一 次 只 能 获得 图 像 的 一 行 信息 ， 被 拍摄 的 物体 每 次 必须 以 直线 形 
式 从 摄像 机 前 移 过 ， 才 能 获得 完整 图 像 。 

在 实际 应 用 中 ， 既 可 以 通过 保持 线 阵 传感器 不 动 目标 物 移 动 的 方式 来 实现 ， 也 可 以 保持 
被 摄 物 不 动 线 阵 传 感 需 的 移动 的 方式 来 实现 。 线 阵 CCD 摄像 机 特别 适合 于 对 以 一 定 速 度 匀 
速 运动 的 物料 流 的 检测 。 

线 阵 CCD 图 像 传感器 分 辩 率 一 般 比 面 阵 CCD 图 像 传感器 行 分 辩 率 高 。 
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4. 面 阵 CCD 传感器 

CCD 感光 单元 有 序 排列 成 二 维 网 状 的 传感器 称 作 面 阵 CCD 图 像 传 感 器 。 面 阵 CCD 摄像 
机 一 次 可 以 获得 整 幅 完整 的 图 像 。 

5. CCD 摄像 机 的 分 类 

CCD 传 感 芯 片 靶 面 的 尺寸 有 1/2in、1/3in、2/3in、1/4in 等 ， 是 CCD 靶 面 对 角 线 的 长 
度 。 而 CCD 的 像素 数 决 定 显示 图 像 的 清晰 程度 和 测量 精度 ， 像 素 越 多 ， 分辨 率 越 高 ， 图 像 
细节 越 清 晰 准确 。 

(1) 按 性 能 不 同 划 分 

CCD 摄像 机 的 基本 结构 是 某 种 CCD 芯片 与 某 种 光学 成 像 物镜 的 结合 。 按 性 能 的 不 同 ， 
可 以 将 它们 分 为 标准 视频 幅面 摄像 机 、 高 分 辩 率 摄像 机 和 静止 视频 画面 摄像 机 。 

1) 标准 视频 幅面 摄像 机 满足 大 众 需 求 ， 行 间 传 输 方式 ， 输 出 标准 视频 信号 ， 幅 面 统 
一 。 芯 片 长 宽 比 为 4:3。 芯 片 对 角 线 尺度 1/2in 的 长 宽 为 6.4mm x4.8mm; 1/3in 的 长 宽 为 
4. 9mm x3.7mm， 像素 间距 5pm; 少量 为 2/3in 和 1/4in。 分辨 率 ， 水 平分 辩 率 为 700 像素 左 
右 ， 垂直 分 辨 率 为 500 像素 左右 。 影 像 输出 频率 为 25 ~ 30Hz。 

2) 高 分 辩 率 摄像 机 “主要 用 于 科研 和 特殊 需要 ， 又 称 科研 用 电视 摄像 机 或 低速 扫描 摄 
像 机 。 幅 面 为 方形 ,分辨 率 高 于 1000 x 1000 像素 ， 如 1024 x 1024 像素 、4096 x 4096 像素 。 
帧 传输 方式 数据 读 出 率 很 低 ， 输 出 频率 为 50Hz 左右 。 

3) 静止 视频 画面 照相 机 “俗称 数码 相机 。 按 分 辩 率 不 同 ， 分 为 低 分 辩 率 面 阵 照 相机 、 
中 高 分 辩 率 面 阵 照 相机 、 高 分 辩 率 扫描 照相 机 。 

(2) 按 成 像 色 彩 划分 

1) 彩色 摄像 机 ”适用 于 景物 色彩 的 辨别 ， 在 亮度 信息 的 基础 上 ， 彩 色 摄 像 机 还 原 了 色 
度 及 饱和 度 信 息 ， 相 关 信 息 更 加 丰富 ， 是 目前 主流 的 摄像 机 。 

2) 黑白 摄像 机 “黑白 摄像 机 由 于 没有 特定 的 彩色 遮 置 装 置 ， 其 输出 的 是 黑白 图 像 。 黑 
白 图像 因 其 仅 携带 黑白 灰 度 信息 ， 因 此 在 表面 纹理 分 析 与 目标 图 像 识别 方面 不 如 彩色 图 像 。 
黑白 摄像 机 适用 于 光线 不 足 ， 或 者 仅 用 于 监视 景物 的 位 置 和 移动 的 场合 ， 对 低 照 度 图 像 和 运 
动物 体 的 适应 能 力 比 彩色 摄像 机 更 高 。 

图 像 处 理 基 本 算法 是 基于 图 像 灰 度 的 ， 了 解 单 通道 的 黑白 图 像 处 理 有 利于 理解 图 像 处 理 
的 一 些 算法 。 灰 度 图 像 处 理 的 大 部 分 算法 均 可 直接 移植 用 于 彩色 图 像 处 理 。 这 是 因为 经 过 色 
彩 分 解 后 的 色 度 分 量 仍然 是 由 灰 度 构成 的 像素 集合 。 因 此 ， 大 多 数 彩色 图 像 算法 都 是 灰 度 图 
像 算法 的 扩展 。 

(3) 按 分 辨 率 划分 

摄像 机 分 辨 率 是 指 图 像 上 能 够 分 辨 清楚 的 像素 点 的 个 数 和 密度 ， 通 党 数字 摄像 机 用 横向 
和 纵向 的 像素 数 来 表示 。 

传统 的 闭路 电视 摄像 机 的 分 辨 率 用 电视 线 (TV LINES) 来 表示 。 摄 像 机 图 像 的 分 辨 率 
与 传感器 单元 数 、 镜 头 分辨 率 和 摄像 机 接口 通道 的 频带 宽度 相 联 系 。 通 常规 律 是 1MHz 的 频 
带宽 度 相 当 于 80 线 清 晰 度 ， 频 带 越 宽 图 像 越 清晰 ， 线 数值 相对 越 大 。 彩 色 电 视 摄 像 机 典型 
分 辩 率 为 330 ~500 线 ， 主 要 有 330 线 、380 线 、420 线 、460 线 和 500 线 等 。 工 业 监视 用 摄 
像 机 的 分 辨 率 通常 为 380 ~ 460 线 。 广 播 级 摄像 机 的 分 辩 率 则 可 达到 700 线 左 右 。 数 字 摄 像 
机 的 分 辩 率 与 显示 器 相关 ， 通 常 VGA 的 为 640 x480 像素 或 者 1024 x768 像素 ， 最 新 的 高 清 
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数字 摄像 机 的 分 辩 率 可 达到 1280 x720 像素 ， 甚 至 1920 x 1080 像素 。 

图 像 传 感 絮 的 像素 数 与 分 辨 率 密 切 相 关 ， 图 像 在 38 万 像素 以 下 为 一 般 型 ， 其 中 以 25 万 
像素 (512 x492 像素 ) 、 分 辨 率 为 400 线 的 产品 最 普遍 。 图 像 在 38 万 像素 以 上 为 高 分 辩 率 
型 摄像 机 ， 在 78 万 像素 以 上 为 超 高 分 辩 率 摄像 机 。 高 分 辩 率 摄像 机 是 高 精度 视觉 测量 的 必 
要 条 件 。 

(4) 按 光 照度 划分 

摄像 机 所 能 接收 的 最 小 光照 度 ， 也 称 摄像 机 灵敏 度 ， 代 表 了 摄像 机 中 图 像 传感器 对 环境 
光线 的 敏感 程度 ， 或 者 传感器 正常 工作 时 所 需 的 最 暗 光 线 。 光 照度 单位 是 lux ( 勒 克 斯 )， 
其 数值 越 小 ， 摄 像 头 越 灵 人 敏 。 最 小 光照 度 低 于 1lux 的 被 称 为 低 照度 摄像 机 。 一 般 认为 : 

1) 普通 型 ， 正 常 工 作 所 需 光 照度 为 1 ~3lux; 

2) 月 光 型 ， 正 常 工作 所 需 光 照度 为 0. 1lux; 

3) 星光 型 ， 又 称 低 照 度 型 ， 正 常 工作 所 需 光 照度 为 0.01lux 以 下 ; 

4) 红外 型 ， 采用 红外 灯 照 明 ， 在 没有 可 见 光 的 情况 下 也 可 以 成 像 。 

(5) 按 传感器 尺寸 划分 

常用 的 CCD 图 像 传 感 器 尺寸 有 1/2in、2/3in、1/3in、1/4in 等 ， 是 指 CCD 图 像 传感器 
的 对 角 线 尺寸 。 在 选用 CCD 摄像 镜头 时 ， 特 别 是 对 视 场 角 有 比较 严格 要 求 时 ，CCD 图 像 传 
感 器 的 大 小 与 镜头 的 配合 情况 将 直接 影响 视 场 角 的 大 小 和 图 像 的 清晰 度 。 不 同 CCD 图 像 传 
感 絮 所 对 应 的 靶 面 大 小 及 对 角 线 长 度 见 表 2. 3。 

表 2.3 CCD 图 像 传 感 器 芯片 尺寸 及 对 应 的 靶 面 和 对 角 线 尺寸 
























































蓝 片 尺寸 靶 面 ( 宽 x 高 ) /mm 对 角 线 长 度 /mm 
lin 12.7 x9.6 16 
2/3in 8.8 x6.6 11 
1/2in 6.4x4.8 8 
1/3in 1.8 x3.6 6 
1/4in 3.2x2.4 4 








(6) 按 扫描 制式 划分 

传统 的 摄像 机 输出 制式 和 电视 机 是 兼容 的 ， 标 准 的 彩色 CCD 摄像 机 输出 的 模拟 信号 可 
以 按照 扫描 方式 分 为 PAL 制式 和 NTSC 制式 。PAL 制式 为 隔行 扫描 ， 标 准 625 行 ，50 场 ， 
黑白 为 CCIR 制式 。NTSC 制式 为 隔行 扫描 ， 标 准 525 行 、60 场 ， 黑 白 为 EIA 制式 。 

(7) 按 供电 电源 划分 

工业 控制 用 摄像 机 供电 电源 共有 交流 24V、110V、220V 和 直流 9V、12V 五 类 。NTSC 
制式 的 摄像 机 多 采用 交流 110V 供电 。 而 PAL 制式 多 采用 交流 220V 供电 。 内 部 不 带 变 压 器 
或 者 电源 适配器 的 则 可 能 采用 交流 24V 或 直流 9V、12V 等 几 种 供电 方式 。 

(8) 按 同步 方式 划分 

1) 内 同步 ”用 摄像 机 内 同步 信号 来 实现 同步 跟踪 。 

2) 外 同步 ”用 由 外 同步 信号 发 生 器 生成 的 同步 信号 送 入 摄像 机 的 外 同步 输入 端口 来 实 
现 同 步 跟 踪 。 

3) 功率 同步 ”用 摄像 机 50Hz 或 者 60Hz 的 AC 电源 信和 号 完成 垂直 同步 扫描 。 
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4) 外 VD 同步 ”依靠 摄像 机 信号 电缆 上 的 VD 同步 脉冲 信号 来 实现 同步 跟踪 。 

5) 多 台 摄 像 机 外 同步 ”使 用 同一 固定 外 同步 信号 对 多 台 摄 像 机 实施 同步 扫描 ， 使 每 全 
摄像 机 可 以 在 同样 条 件 下 作业 。 这 样 即 使 其 中 一 台 摄像 机 转换 瞄准 对 象 ， 达 到 同步 跟踪 的 摄 
像 机 ， 其 画面 也 不 会 失真 。 


2. 3. 2 ”CMOS 图 像 传感器 


1. CMOS 图 像 传感器 的 发 展现 状 

自 20 世纪 90 年 代 初 以 来 ， 已 经 研制 出 三 类 CMOS 图 像 传 感 嚣 ， 即 CMOS 无 源 像 素 图 像 
传感器 (CMOS PPS) 、CMOS 有 源 像素 图 像 传 感 器 〈(CMOS APS) 和 CMOS 数字 像素 图 像 传 
感 器 (CMOS DPS) 。 其 中 ，CMOS 有 源 像素 图 像 传感器 发 展 最 快 。 目 前 ，CMOS 有 源 像素 图 
像 传感器 的 开发 目标 在 于 提高 传感器 的 综合 性 能 ， 缩 小 单元 尺寸 ,调整 CMOS 工艺 参数 ， 完 
善 器 件 性 能 。 随 着 亚 微米 、 深 亚 微米 和 Sol CMOS 工艺 的 不 断 发 展 和 器 件 结构 的 改进 ， 
CMOS 图 像 传感器 性 能 不 断 提高 ， 成 为 继 CCD 图 像 传感器 之 后 普遍 应 用 的 多 功能 摄像 器 件 。 
虽然 ， 目 前 CMOS 图 像 传感器 在 高 端 应 用 领域 还 与 CCD 图 像 传 感 器 有 一 定 差距 ， 但 它 的 发 
展 前 景 是 广阔 的 ， 已 成 功 占领 图 像 传 感 器 的 中 低 端 市 场 ， 例 如 汽车 尾 视 、 电 梯 监 控 、 超 市 防 
盗 、 高 速 公路 车 流量 监视 、 网 络 相 机 、 儿 童 玩具 、 手 机 相机 、 医 用 仪器 仪表 等 都 有 应 用 ， 形 
成 了 与 CCD 图 像 传 感 器 的 竞争 状态 。 

2. CMOS 图 像 传感器 的 总 体 结构 

CMOS 图 像 传 感 需 主要 由 以 下 模块 组 成 。 

(1) 像素 单元 阵列 

采用 四 个 有 源 像素 单元 结构 ， 完 成 对 光电 信号 的 采集 功能 。 

(2) 模拟 功能 模块 

包括 相关 采样 电路 ， 对 像素 的 光电 信号 进行 采样 。 增 益 放大 器 ， 用 于 将 像素 采样 得 到 的 
电信 号 进行 可 编程 增益 放大 ， 然 后 交 给 A-D 转换 器 进行 处 理 。 

(3) 数字 控制 模块 

包括 行列 地 址 选择 译 码 器 ， 为 像素 阵列 提供 可 靠 的 行 、 列 信号 选择 地 址 ， 使 各 像素 信和 号 
能 够 有 序 地 读 出 。 数 字 时 序 控制 单元 ， 为 整个 传感器 电路 提供 可 靠 的 时 序 控制 信 叶 。 数 字 图 
像 预 处 理 模块 ， 对 A-D 转换 器 输出 的 数字 信号 进行 处 理 ， 如 坏 像素 检测 与 补偿 、 色 彩 插值 、 
色彩 校正 、 自 动 白 平衡 、 色 彩 空间 转换 等 。 寄 存 器 模块 用 于 保存 及 动态 更 新 CMOS 图 像 传 感 
器 工作 所 需 参 数 等 。 

3. CMOS 图 像 传感器 像素 结构 

CMOS 图 像 传感器 像素 电路 可 分 为 无 源 像素 和 有 源 像素 结构 。 主 要 有 三 种 像素 结构 ， 即 
光敏 二 极 管 型 无 源 像素 结构 、 光 敏 二 极 管 型 有 源 像素 结构 和 光电 栅 极 型 有 源 像素 结构 。 

(1) 无 源 像素 图 像 传感器 像素 单元 结构 

无 源 像素 图 像 传 感 器 (Passive Pixel Sensor，PPS) 的 像素 单元 基本 结构 如 图 2. 40 所 示 ， 
它 由 一 个 光敏 二 极 管 和 开关 管 TX 组 成 。 当 TX 选 通 时 ， 光 敏 二 极 管 中 由 于 光照 产生 的 相应 
电荷 就 传送 到 列 线 。col 下 端的 积分 放大 器 将 该 信号 转化 为 电压 输出 。 光 敏 二 极 管 中 产生 的 
电荷 与 光 信 号 成 一 定 的 比例 关系 。 无 源 像素 单元 的 结构 简单 、 像 素 填充 率 高 、 量 子 效 率 高 ， 
但 读 出 噪声 大 ， 因 此 ，PPS 不 利于 向 大 型 阵列 发 展 和 提高 读 出 速率 。 
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(2) 有 源 像素 图 像 传感器 像素 单元 结构 TX | 

有 源 像素 图 像 传感器 ( Active Pixel Sensor，APS) 的 像 -== = 
素 单元 内 有 有 源 放大 器 。 像 素 单 元 内 缓冲 放大 器 可 改善 像素 
性 能 ， 并 且 放 大 器 仅 在 读 出 时 激活 ， 因 而 功 耗 可 最 小 化 。 与 & 
CMOS PPS 相 比 ，CMOS APS 与 隔行 传输 CCD 类 似 ， 是 以 损 小 
失 光 信号 来 获得 性 能 的 改善 。 与 CMOS PPS 相 比 ，CMOS 
APS 读 出 噪声 低 ， 改 善 了 巨大 阵列 结构 的 标 度 性 ， 读 出 速度 col 
较 高 。 

1) 光敏 二 极 管 型 APS (3T) ”图 2.41 所 示 是 光敏 二 极 “图 2 40 PPS 的 像素 单元 结构 
管 型 APS 的 像素 单元 结构 ， 它 由 光敏 二 极 管 、 复 位 管 M 、 源 跟随 器 M 和 行 选 通 管 M; 组 
成 。 由 于 其 结构 中 含有 3 个 晶体 管 ， 所 以 也 被 称 为 3T 结构 。 光 敏 型 二 极 管 型 APS 的 工作 过 
程 如 下 : 首先 进入 “复位 状态 ”，M, 打开 ， 对 光敏 二 极 管 复位 ; 然后 进入 “取样 状态 ”，M， 
关闭 ， 光 照射 到 光敏 二 极 管 上 产生 载 流 子 ， 并 通过 源 跟随 器 M, 放大 输出 ; 最 后 进入 “ 读 出 
状态 ”， 这 时 行 选 通 管 M; 打开 ， 信 和 号 通过 列 总 线 输出 。APS 像素 单元 结构 里 引入 了 源 跟 随 
器 M, ， 以 实现 信号 的 放大 和 缓冲 ， 能 够 改善 PPS 的 噪声 问题 。 源 跟随 器 还 可 加 快 总 线 电容 
的 充 放电 ， 因 而 允许 增加 总 线 长 度 和 增 大 像素 规模 。 通 常 APS 比 PPS 有 更 多 的 优点 ， 包 括 
低 读 出 噪声 和 高 读 出 速率 等 。 但 是 由 于 其 结构 复杂 ， 导 致 填充 率 降 低 。 为 了 克服 这 个 缺点 ， 
可 以 使 用 微 透 镜 阵列 ， 它 能 改变 人 射 光 线 的 方向 ， 使 本 来 落 到 连接 点 或 晶体 管 上 的 光线 重新 
回 到 光敏 区 。CMOS APS 的 另 一 个 不 利 因 素 是 每 个 像素 中 放大 器 的 阔 值 电压 不 可 能 完全 相 
同 ， 这 种 不 均匀 性 会 引起 传感器 的 固定 模式 噪声 ( Fixed Pattern Noise，FPN) 。 它 表现 为 图 
像 上 不 必要 的 背景 花纹 ， 因 此 需 采取 措施 对 固定 模式 噪声 进行 抑制 。 

2) 光栅 型 APS (4T) ”光栅 型 APS 生成 的 图 像 质量 较 
高 。 其 像素 单元 感光 结构 由 光栅 PG 和 传输 门 TX 构成 。 光 栅 
输出 端 为 漂移 扩散 端 FD， 与 光栅 PG 被 传输 门 TX 隔 开 。 像 asrd| Mm 站 





















































素 单元 还 包括 一 个 复位 晶体 管 M, ， 一 个 源 跟随 器 M, 和 一 个 
行 选 通 晶体 管 M; 。 读 出 电路 为 每 列 共 有 。 后 面 将 接 采 样 保持 
电路 用 来 存储 信号 电 平 和 复位 电 平 ， 以 实现 相关 双 采 样 * 仆 
( Correlated Double Sampler，CDS)。CDS 技术 可 以 抑制 像素 中 
FD 端 复 位 噪声 、1X7 噪 声 及 由 像素 阵列 内 源 跟 随 器 阀 值 电压 本 
不 匹配 所 引起 的 固定 模式 噪声 。 每 列 读 出 电路 中 采用 了 沟 道 
源 跟 随 器 ， 与 像素 阵列 中 的 N 沟 道 源 跟随 器 形成 互补 。 开 关 
晶体 管 既 可 以 采用 P 沟 道 型 也 可 以 采用 NN 沟 道 型 。 


2.3.3 ”CCD 与 CMOS 图 像 传感器 的 差异 


CCD 与 CMOS 图 像 传感器 都 利用 光敏 二 极 管 进行 光电 转换 ， 主 要 差异 是 数字 数据 传输 
方式 不 同 。CCD 每 一 行 中 每 一 个 像素 的 电荷 数据 依次 传送 到 下 一 像素 中 ， 由 最 端 部 分 单元 
输出 ， 再 经 由 传感器 边缘 的 放大 器 进行 放大 和 输出。 而 CMOS 图 像 传感器 中 每 个 像素 都 会 邻接 
一 个 放大 器 及 A-D 转换 电路 ， 用 类 似 内 存 电路 的 方式 将 数据 输出 。 另 外 ，CCD 图 像 传 感 器 
的 特殊 工艺 可 保证 数据 在 传送 时 不 会 失真 ， 各 个 像素 的 数据 可 汇聚 至 边缘 再 进行 放大 处 理 。 

















图 2.41 光敏 二 极 管 型 APS 
像素 单元 结构 
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而 CMOS 图 像 传感器 数据 在 传送 距离 较 长 时 会 产生 噪声 ， 必 须 先 放大 ， 再 整合 各 个 像素 数 
据 。 

CCD 与 CMOS 图 像 传感器 在 效能 与 应 用 上 也 有 诸多 差异 ( 见 图 2. 42)， 包 括 : 

1) 灵敏 度 差异 ”由 于 CMOS 图 像 传感器 的 每 个 像素 有 4 个 晶体 管 与 1 个 光敏 二 极 管 构 
成 ， 含 放大 器 与 A-D 转换 电路 ， 使 得 每 个 像素 的 感光 区 域 远 小 于 像素 本 身 的 表面 积 。 因 此 
在 像素 尺寸 相同 的 情况 下 ，CMOS 图 像 传感器 的 灵敏 度 要 低 于 CCD 图 像 传感器 。 

2) 分 辩 率 差异 CMOS 图 像 传感器 的 每 个 像素 都 比 CCD 图 像 传感器 复杂 ， 其 像素 尺寸 
很 难 达 到 CCD 图 像 传感器 的 水 平 ， 因 此 比较 相同 尺寸 的 CCD 图 像 传感器 与 CMOS 图 像 传 感 
器 时 ，CCD 图 像 传感器 的 分 辩 率 通常 会 优 于 CMOS 图 像 传 感 器 的 水 平 。 

3) 噪声 差异 ”由 于 CMOS 图 像 传 感 器 的 每 个 光敏 二 极 管 都 必须 搭配 一 个 放大 器 ， 而 放 
大 器 属于 模拟 电路 ， 很 难 让 每 个 放大 器 所 得 到 的 结果 保持 一 致 。 因 此 与 只 有 一 个 放大 器 的 放 
在 芯片 边缘 的 CCD 图 像 传感器 相 比 ，CMOS 图 像 传感器 的 噪声 会 增加 很 多 ， 影 响 图 像 品质 。 

4) CMOS 图 像 传感器 的 价格 比 CCD 图 像 传感器 低 。 

5) CMOS 图 像 传 感 右 的 耗 电量 比 CCD 网 像 传 感 需 的 耗 电 量 低 。 
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图 2.42 CCD 与 CMOS 图 像 传感器 





2.4 图 像 采集 卡 


1. 图 像 采 集 卡 简介 
图 像 采 集 卡 是 控制 摄像 机 完成 图 像 采 集 与 数字 化 ， 压 缩编 码 成 数字 视频 序列 的 硬件 设 
备 。 在 模拟 到 数字 的 转换 过 程 中 所 使 用 的 完成 信号 调理 的 专用 硬件 。 一 般 图 像 采集 卡 采用 压 
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缩 算法 把 数字 化 的 视频 信号 存储 成 AVI 文件 ， 高 档 的 图 像 采 集 卡 直接 把 采集 到 的 数字 视频 
数据 实时 压缩 成 MPEG-1 格式 的 文件 。 图 像 采 集 卡 还 有 协调 整个 图 像 采 集 系 统 的 作用 。 

图 像 采集 卡 主要 完成 对 模拟 视频 信号 的 数字 化 处 理 过 程 。 

1) 摄像 机 对 输入 的 视频 信号 进行 实时 采集 ， 视 频 信 号 首先 经 低 通 滤波 器 滤波 ， 转 换 为 
时 间 上 连续 的 模拟 信和 号。 

2) 按照 应 用 系统 对 图 像 分 辩 率 的 要 求 ， 用 采样 /保持 电路 对 连续 的 视频 信和 号 在 时 间 上 进 
行 间 隔 采样 ， 把 视频 信和 号 转换 为 离散 的 模拟 信号。 

3) 经 A-D 转换 后 存储 在 图 像 存 储 单元 的 一 个 或 多 个 信道 中 ,通过 计算 机 发 出 指令 ,将 
某 一 帧 图 像 静 止 在 图 像 存 储 信道 中 ， 即 采集 或 捕获 了 一 帧 图 像 。 

2. 图 像 采 集 卡 分 类 

(1) 根据 输入 信号 类 型 

1) 模拟 图 像 采 集 卡 ”目前 ,广泛 应 用 的 摄像 机 是 模拟 信号 摄像 机 ， 相 应 采用 的 图 像 采 
集 卡 也 是 模拟 图 像 采 集 卡 。 模 拟 图 像 采 集 卡 上 设 有 A-D 转换 芯片 ， 其 对 输入 信号 以 4: 2: 2 
格式 进行 采样 ， 然 后 进行 量化 。 一 般 对 RGB 的 8 位 量化 ， 则 传 入 的 视频 信号 转换 为 数字 图 
像 信号 。 

2) 数字 图 像 采 集 卡 “与 数字 摄像 机 配套 使 用 的 图 像 采集 卡 ， 可 称 为 数字 图 像 采集 卡 。 

(2) 根据 采集 信号 的 类 型 

1) 彩色 图 像 采 集 卡 “彩色 图 像 采集 卡 可 以 采集 彩色 图 像 和 同 灰 度 级 别 的 黑白 图 像 。 

2) 黑白 图 像 采集 卡 ” 黑 白 图 像 采集 卡 可 以 采集 黑白 图 像 。 

(3) 根据 CCD 摄像 机 类 型 

1) 面 扫描 图 像 采 集 卡 ”与 面 扫描 摄像 机 机 配套 使 用 ， 一 般 不 支持 线 扫描 摄像 机 。 

2) 线 扫描 图 像 采集 卡 ” 配 合 线 扫描 摄像 机 机 使 用 ， 也 支持 面 扫描 摄像 机 。 

(4) 复合 信号 采集 卡 和 RGB 分 量 信号 输出 采集 卡 

3. 图 像 采 集 卡 结构 功能 

图 像 采集 卡 的 结构 功能 包括 : 

1) 模拟 图 像 信 号 的 接收 、 滤 波 、 采 样 与 A-D 转换 模块 ， 即 负责 图 像 信 号 的 放大 与 数字 
化 。 

2) 摄像 机 控制 输入 /输出 接口 ， 负 责 协 调 摄像 机 进行 同步 或 实现 异步 重 置 拍摄 、 定 时 拍 
摄 等 。 

3) 总 线 接口 ， 以 便 通过 计算 机 内 部 高 速 输出 数字 数据 。 一 般 是 PCI 接口 ， 传 输 速 率 可 
高 达 130Mbit/s， 可 进行 高 精度 图 像 的 实时 传输 ， 且 占用 较 少 的 CPU 时 间 。 此 外 ， 目 前 还 有 
USB 接口 等 。 

4. 图 像 采 集 卡 技术 参数 

(1) 图 像 传输 格式 

图 像 采集 卡 支 持 系统 中 摄像 机 所 采用 的 输出 信号 格式 。 大 多 数 摄像 机 采用 RS422 或 
LVDS 作为 输出 信号 格式 。 在 数字 摄像 机 中 ，IEEE1394 、USB2. 0 和 Camera Link 几 种 图 像 传 
输 形 式 则 应 用 广泛 。 

(2) 图 像 格式 〈 像 素 格式 ) 

黑白 图 像 的 图 像 灰 度 等 级 可 分 为 256 级 ， 即 以 8 位 表示 。 在 图 像 灰 度 有 更 精确 的 要 求 
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时 ， 可 用 10 位、12 位 等 来 表示 。 

彩色 图 像 可 由 RGB (YUV) 三 种 色彩 组 合 而 成 ， 根 据 其 亮度 级 别 的 不 同 有 8-8-8 ，10- 
10-10 等 格式 。 

(3) 传输 通道 数 

当 摄像 机 以 较 高 速率 拍摄 高 分 辩 率 图 像 时 ， 输 出 速率 会 很 高 。 这 一 般 需 要 多 路 信和 号 同时 
输出 ， 或 多 个 摄像 机 同时 接 和 计算机。 图 像 采 集 卡 应 能 支持 多 路 输入 。 一 般 情况 下 ,， 有 1 
路 、 2 路 、 4 路、8 路 输入 等 。 

(4) 分 辩 率 

采集 卡 能 支持 的 最 大 点 阵 反 映 了 其 分 辩 率 的 性 能 。 一 般 采 集 卡 能 支持 768 x 576 点 阵 ， 
而 性 能 优异 的 采集 卡其 支持 的 最 大 点 阵 可 达 64K x 64K。 单 行 最 大 点 数 和 单 帧 最 大 行 数 也 可 
反映 采集 卡 的 分 辨 率 性 能 。 

(5) 采样 频率 

采样 频率 反映 了 采集 卡 处 理 图 像 的 速度 和 能 力 。 在 进行 高 质量 的 图 像 采 集 时 ， 需 要 注意 
采集 卡 的 采样 频率 是 否 满足 要 求 。 目 前 高 档 的 采集 卡其 采样 频率 可 达 65MHz。 

(6) 传输 速率 

这 是 指 图 像 从 采集 卡 到 计算 机 内 存 的 能 力 。 图 像 采 集 卡 与 计算 机 主板 间 都 采用 PCI 接 
口 ， 其 理论 传输 速度 为 132Mbit/s。PCI-E，PCI-X 是 更 高 速 的 总 线 接口 。 

(7) 帧 和 场 

标准 模拟 视频 信号 是 隔行 信号 ， 一 帧 分 成 两 场 ， 偶 数 场 包 含 所 有 偶数 行 ， 奇 数 场 包含 所 
有 奇数 行 。 采 集 和 传输 过 程 使 用 的 是 场 而 不 是 帧 ， 一 帧 图 像 的 两 场 之 间 有 时 间 差 。 

5. 选择 图 像 采 集 卡 时 需 注 意 的 问题 

1) 选择 的 图 像 采集 卡 要 支持 摄像 机 的 扫描 方式 ， 如 摄像 机 是 面 扫描 还 是 线 扫 描 的 。 图 
像 采 集 卡 需要 支持 CCD 摄像 机 所 采用 的 信号 输出 形式 ， 摄 像 机 的 输出 形式 有 RS422 等 标准 。 
选择 图 像 采集 卡 要 支持 摄像 机 所 采集 的 图 像 类 型 ， 摄 像 机 所 采集 的 图 像 类 型 可 能 是 8 位 、10 
位 、12 位 、14 位 、16 位 、32 位 的 黑白 或 彩色 图 像 。 

2) 当 检 测 系 统 中 采用 多 个 CCD 摄像 机 方案 时 ， 选 择 采 集 卡 要 有 数字 LO 功能 ， 以 保证 
多 路 视频 信号 的 同步 性 ， 并 且 支 持 多 路 输入 和 输出 。 

3) 对 于 基于 PCI 接口 的 图 像 采 集 卡 应 该 有 数据 缓存 ， 以 免 瞬间 数据 流 大 导致 数据 丢失 。 


2.5 人 工 标志 及 被 测 物 体 表面 处 理 


在 视觉 测量 系统 中 ， 低 精度 摄影 测量 可 以 使 用 物体 本 身 的 特征 作为 测量 特征 ， 但 对 高 精 
度 测 量 和 物体 空间 描述 ， 物 体 本 身 的 特征 是 不 够 明显 和 充分 的 。 即 被 测 物体 没有 明显 的 特征 
点 和 对 比 度 特征 ， 或 被 测 物体 虽 有 具有 明显 的 特征 ， 但 由 于 工业 现场 测量 需要 多 个 测量 站 来 实 
现 对 物体 的 测量 ， 从 不 同 角度 进行 摄影 时 会 产生 不 同 的 图 像 ， 不 能 对 被 测 物体 上 的 待 测 位 置 
进行 有 效 识 别 和 精确 定位 。 因 此 ， 当 使 用 图 像 处 理 和 分 析 等 技术 不 能 可 靠 地 识别 和 精确 定位 
物体 特征 时 ， 需 要 通过 在 被 测 物体 上 增加 具有 明显 特征 的 人 工 标志 来 辅助 完成 测量 过 程 。 视 
觉 测量 中 使 用 人 工 标志 ， 一 方面 可 以 保证 和 提高 测量 的 精度 和 可 靠 性 ; 另 一 方面 人 工 标志 容 
易 布 设 ， 在 工业 测量 现场 及 其 他 精密 测量 现场 ， 利 用 人 工 标志 作为 被 测 点 或 控制 点 可 以 提高 
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被 测 物体 成 像 点 的 辨认 和 识别 ， 并 实现 自动 化 测量 ， 提 高 测量 效率 。 人 工 标志 在 视觉 测量 系 
统 中 的 广泛 应 用 主要 有 以 下 三 点 原因 : 
1) 从 图 像 处 理 、 目 标 检测 角度 ， 人 工 标 志 可 以 保证 或 提高 测量 精度 和 可 靠 性 。 
2) 与 航空 摄影 测量 相 比 较 ， 大 量 的 人 工 标 志 的 布设 并 不 是 一 件 困难 的 事情 。 
3) 易于 实现 自动 测量 。 


2.5.1 一 般 人 工 标志 


人 工 标志 的 质地 、 形 状 和 大 小 与 测量 方法 、 测 量 对 象 的 要 求 及 环境 有 关 。 为 了 满足 不 同 
测量 任务 和 测量 环境 的 需要 ， 设 计 了 各 种 类 型 的 人 工 标志 ， 要 根据 不 同 的 测量 环境 和 测量 对 
象 选择 不 同 的 测量 标志 。 

人 工 标志 常用 的 材质 包括 纸张 、 磁 铁 、 不 锈 钢 、 扩 瓷 等。 人工 标 志 或 者 用 作 控 制 点 或 者 
用 作 待 测 未 知 点 ， 一 般 不 用 自然 物 作 为 控制 点 使 用 。 

使 用 过 的 人 工 标志 有 几 十 种 ， 岁 2. 43 所 示 为 几 种 人 工 标 志 ， 图 2. 44 所 示 为 一 种 经 常 在 


圆柱 上 使 用 的 人 工 标志 。 
四 十 * 
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图 2.43” 几 种 人 工 标 志 
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图 2.44 经 常 在 圆柱 上 使 用 的 人 工 标志 











2. 5.2 ”人 工 标志 的 设计 原则 


作为 测量 点 使 用 的 人 工 标志 ， 其 几何 形状 的 设计 需 同 时 考虑 两 项 最 基本 要 求 : 

1) 要 以 适宜 的 尺寸 成 像 ; 

2) 必须 为 控制 测量 测定 其 坐标 时 ， 标 示 精 细 而 明确 的 目标 。 

因此 人 工 标 志 要 满足 如 下 设计 原则 . 

1) 人 工 标 志 的 几何 形状 不 宜 复 杂 ， 否 则 会 影响 它 的 人 工 或 自动 识别 与 测量 。 人 工 标记 
一 般 设计 为 贺 形 ， 便 于 识别 和 精确 定位 中 心 。 

2) 人 工 标志 常 取 黑 白 相 间 的 颜色 。 有 时 还 要 考虑 标志 自身 颜色 和 背景 颜色 反差 要 尽量 
大 。 同 颜色 标志 最 好 使 其 构 像 的 颜色 与 坐标 量 测 装置 的 测 标 颜 色相 反 。 
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3) 人 工 标志 成 像 尺 寸 与 摄影 比例 有 关 。 标 志 太 小 ， 图 像 中 的 像素 数量 不 够 ， 影响 提取 
精度 。 标 志 太 大 ， 会 产生 偏心 差 问 题 。 人 工 标记 图 像 在 直径 方向 成 像 至 少 应 占 3 x3 像素 ， 
最 优 的 标志 成 像 在 直径 上 应 在 7 ~ 15 个 像素 之 间 。 在 最 好 的 摄像 条 件 下 ， 确 定 人 工 标志 
的 一 般 规 律 是 标志 的 尺寸 至 少 应 是 被 测 物 体 尺 寸 的 1/1000。 在 一 般 的 摄像 条 件 下 ， 标 志 
才 最 好 是 最 佳 摄 像 条 件 下 尺寸 的 两 倍 左右 。 

4) 三 维 测 量 时 ， 标 志 物 经 常设 计 成 辐射 状 。 

2. 5.3 ”人 工 标志 的 分 类 

1. 外 形状 况 

(1) 平面 型 

平面 标志 多 用 于 从 一 个 角度 测量 被 测 物 体 。 

(2) 立体 型 

可 将 直径 相宜 的 钢珠 、 钢 球 、 玻 璃 球 、 塑 料 球 或 特意 加 工 的 球形 体 作为 球形 标志 ， 如 图 
2. 45 所 示 。 多 用 于 从 多 个 角度 测量 物体 ， 以 便 环 绕 目 标 测量 物体 。 














图 2.45 立体 型 人 工 标记 








2. 发 光 情 况 

(1) 主动 发 光标 志 

主动 发 光标 志 就 是 某 种 点 光源 ， 点 光源 可 以 是 一 般 的 灯泡 、 频 闪 发 光 二 极 管 、 激 光 产 生 
的 光 点 标志 等 。 它 们 贴 附 或 固定 在 被 测 物体 上 。 主 动 发 光标 志 多 用 于 动态 物体 的 测定 。 

(2) 被 动 发 光标 志 

被 动 发 光标 志 是 最 常 使 用 的 人 工 标志 ， 通 过 反射 外 来 光源 成 像 ， 有 如 下 两 种 : 

1) 一 般 反 射 类 型 ; 

2) 回 光 反 射 类 型 。 

3. 接触 方式 

(1) 非 接 触 方式 

此 方式 是 指 由 投影 产生 的 光 点 或 结构 光标 志 。 

(2) 接触 方式 

此 方式 是 指 需 人 工 辅 助 固定 在 被 测 物 上 的 标志 。 


2.$.4 回 光 反 射 标志 


回 光 反 射 标志 是 高 精度 摄影 测量 和 特种 摄影 测量 常用 的 贴 附 在 被 测 物体 表面 上 的 一 种 人 
工 标 志 。 在 特定 位 置 光源 的 照射 下 ， 它 可 以 反射 高 亮度 。 
1. 回 光 反 射 标志 材料 
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回 光 反 射 材料 中 含有 一 种 高 折射 率 玻璃 微 珠 或 微 晶 立方 角 体 ， 将 和 人 射 光 按 原 路 反射 回 光 
源 处 ， 形 成 反射 现象 。 回 光 反 射 材 料 主 要 包括 反射 膜 、 反 光 布 、 反 光 革 、 反 光 油 、 反 光 织 
带 、 反 光 安 全 丝 织 物 等 。 这 些 材 料 在 交通 标志 中 都 有 应 用 。 

2. 回 光 反 射 原理 

如 图 2. 46 所 示 ， 回 光 反 射 材料 对 光 的 反射 能 力 取决 于 两 个 角度 ， 即 光线 人 射 角度 y 与 
光源 偏差 角 B (或 观测 角 ) 。 光 线 和 人 射 角 y 是 指 光源 轴线 与 回 光 反 射 材料 所 在 的 平面 法 线 夹 
角 。 光 源 偏差 交角 B 是 指 光 轴线 与 摄像 机 光 轴 的 夹 角 。 光 源 偏差 角 B 越 小 ， 回 光 反 射 材料 的 
反射 能 力 越 强 。 为 了 减 小 8B， 通 常用 于 微 距 摄影 的 环形 闪光 灯 。 它 可 以 套装 在 摄影 镜头 前 
面 ， 从 而 保证 闪光 灯光 轴 与 摄影 光 轴 同 轴 ， 即 8 几乎 为 零 。 

使 用 回 光 反 射 标志 时 ， 光 源 的 入 射 角 不 





人 闪光 灯光 源 轴线 
能 太 大 ， 即 摄影 主 光 轴 与 回 光 反 射 标志 平面 
法 线 的 夹 角 有 角度 限制 。 如 果 超过 一 定 角 度 ， pr 





标志 的 成 像 效 果 非 常 差 。 最 大 角度 不 要 超过 
60°。 视 觉 测 量 中 的 摄影 角度 范围 如 图 2. 47 所 
示 。 

3. 回 光 反 射 膜 及 应 用 

这 种 回 光 反 射 膜 一 面 带 有 背 胶 ， 能够 粘 > 
贴 在 被 测 物 体 上 ， 男 一 面 由 直径 大 约 50pm 的 标志 平面 
玻璃 微 珠 或 微 晶 立方 角 体 组 成 。 如 图 2. 48 所 图 2 46 人 射 角 与 光源 偏差 角 示 意图 
示 ， 每 个 微 珠 像 猫 眼 或 反射 棱镜 一 样 ， 反 射 
光 方 向 与 人 射 光 的 方向 相同 。 为 了 得 到 这 样 的 特征 ， 每 个 玻璃 微 珠 的 折射 率 应 该 在 1.9 左 
右 。 但 是 由 于 玻璃 微 珠 的 形状 不 可 能 十 分 完整 和 不 同 光 有 不 同 的 角度 偏差 ， 反 射 光 不 可 能 与 
入 射 光 完全 平行 。 




















早 角度 =120° 


图 2.47 摄影 角度 范围 示意 图 
在 特定 位 置 光 源 照射 下 ， 回 光 反 射 标志 通过 摄像 机 低 强度 曝光 就 可 以 产生 高 对 比 度 的 标 
志 图 像 。 这 种 标志 的 效率 是 同等 光照 条 件 下 普通 白色 标志 效率 的 100 ~ 1000 倍 以 上 。 图 
2. 49 所 示 为 回 光 反 射 标志 形 成 的 准 二 值 图 像 。 布 设 有 回 光 反 射 标志 的 目标 物 的 图 像 ， 如 大 
型 雷达 天 线 等 ， 通 过 低 强 度 曝 光 可 以 产生 高 对 比 度 标志 图 像 ， 即 准 二 值 影 像 。 在 高 精度 标志 
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0" 入射 角 





45° 


4 
人 入 射 角 
0 
、 ete 
图 2. 48 ”玻璃 微 珠光 线 反射 示意 医 
图 像 测量 中 可 以 对 这 些 准 二 值 影像 进行 快速 、 精 确 、 可 靠 的 定位 。 在 这 类 影像 上 ， 目 标 物 自 
身影 像 消 隐 ， 回 光 反 射 标志 的 影像 却 特别 清晰 而 突出 ， 形 成 了 一 个 背景 暗淡 、 仅 有 一 群 一 般 


呈 圆 形 或 顶 圆 形 的 亮点 。 通 过 图 像 处 理 的 阔 值 技术 或 搜索 定位 技术 ， 可 以 快速 而 准确 地 测定 
它们 的 几何 位 置 。 


2 




















回 光 反 射 标志 














图 2.49 回 光 反 射 标志 与 普通 白色 标志 对 比 

2.5.5 ”常用 人 工 标记 

1. 球形 标志 

同形 平面 标志 图 像 的 形状 与 摄像 机 主 光 轴 和 标志 平面 法 线 夹 角 有 关 。 摄 像 机 主 光 轴 与 平 
面 法 线 平行 的 正直 摄影 情况 下 ， 圆 形 标志 的 成 像 也 为 圆 形 。 但 非 正直 摄影 情况 下 ， 圆 形 标志 
的 成 像 为 椭圆 或 圆锥 的 一 部 分 。 随 着 摄像 机 主 光 轴 与 标志 法 线 夹 角 增 大 ， 标 志 图 像 所 成 的 椭 
圆 越 窗 。 椭 圆 图 像 越 罕 ， 在 检测 、 识 别 时 会 增加 难度 、 降 低 定 位 精度 。 

球形 标志 具有 旋转 不 变性 ， 其 图 像 与 视角 无 关 ， 理 想 情 况 下 是 圆 形 ， 特 别 适 合 大 角度 交 
向 摄影 的 应 用 。 球 形 标志 是 选择 球状 物体 作为 摄影 测量 的 标志 ， 可 以 使 用 钢 球 、 玻 璃 球 、 塑 
料 球 或 特殊 加 工 的 球形 作为 标志 。 通 过 与 外 部 照明 配合 ， 可 以 生成 圆 形 图 像 。 

球形 标志 在 实际 测量 中 的 不 足 表现 在 : 

1) 对 外 部 照明 敏感 ， 当 照明 光线 与 球形 表面 交角 减 小 时 ， 会 产生 阴影 。 

2) 如 果 光 源 位置 离 摄像 机 太 近 ， 标 志 图 像 的 中 心 是 最 亮 的 点 ， 而 从 中 心 到 边缘 亮度 逐 
渐变 暗 。 

3) 如 果 光 源 、 摄 像 机 与 标志 不 在 同一 条 直线 上 ， 标 志 图 像 中 最 亮点 不 在 标志 图 像 的 圆 
形 中 心 。 
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4) 由 于 球形 标志 的 实际 形状 影响 ， 球 形 标志 图 像 的 边缘 与 背景 之 间 对 比 度 不 如 平面 标 
志 图 像 边缘 与 背景 之 间 的 对 比 度 明 显 。 

2. 普通 漫 反射 标志 

如 图 2. 50 所 示 ， 摄 影 测 量 中 的 普通 温 反 射 标志 一 般 是 以 白色 为 背景 的 黑色 圆 或 以 黑色 
为 背景 的 白色 圆 ， 这 样 的 标志 图 像 与 背景 之 间 会 有 较 大 的 对 比 度 ， 识 别 和 定位 比较 容易 。 这 
种 标志 主要 通过 漫 反 射 进行 成 像 ， 制 作 方便 ， 不 需要 特殊 的 材料 和 制作 工艺 。 

















图 2.50 白色 背景 的 黑色 漫 反 射 标志 

普通 漫 反射 标志 在 测量 过 程 中 不 需 特殊 照明 ， 只 要 测量 过 程 中 具有 自然 光 或 者 标志 对 于 
人 有 眼 可 见 的 情况 下 就 可 以 进行 。 而 且 这 种 标志 的 成 像 受 摄影 角度 影响 很 小 ， 在 测量 中 可 以 进 
行 大 角度 摄影 。 白 色 和 背景 下 的 黑色 普通 标志 是 视觉 测量 或 近景 数字 摄影 测量 常用 的 人 工 标 
ee 

3. 彩色 标志 

RGB 由 红 、 绿 、 蓝 三 原色 构成 ， 多 数 颜色 可 以 通过 三 原色 按照 不 同比 例 合 成 。 红 、 绿 、 
蓝 三 原色 是 互相 独立 的 ， 任 何 一 种 颜色 都 不 能 由 其 他 两 种 颜色 合成 。 

工业 数字 摄影 测量 使 用 彩色 标志 是 利用 光 的 相 颜色 的 反射 规律 
减 混 色 法 。 在 白 光照 射 下 ， 青 色 颜 料 可 吸收 红色 而 
反射 青色 ， 黄 色 颜 料 吸 收 蓝 色 而 反射 黄色 ， 品 红颜 白光 
料 吸收 绿色 而 反射 品 红 ， 即 白色 -红色 = 青色 ， 白 
色 - 绿 色 = 品 红 , 白色 - 蓝 色 = 黄色 ， 如 果 混 合 青 
色 和 黄色 两 种 颜料 ， 在 白光 照射 下 ， 由 于 颜料 吸收 
了 红色 和 蓝 色 而 反射 绿色 。 相 减 混 色 就 是 以 吸收 三 红色 以 外 的 颜色 吸收 
原色 比例 不 同 而 形成 的 颜色 。 所 以 有 青色 、 品 红 、 图 2.51 白色 光照 射 红色 标志 示意 轿 
黄色 称 为 颜料 三 原色 。 

通过 相 减 混 色 可 以 有 效 地 对 彩色 标志 进行 识别 ， 不 足 之 处 是 丢失 标志 的 空间 分 辨 率 。 在 
特殊 场合 通过 使 用 特殊 色彩 标志 ， 通 过 选择 照明 色 及 运用 补 色 手法 ， 使 难以 摄取 的 图 像 得 到 
很 好 的 成 像 效 果 或 得 到 更 优质 的 图 像 。 如 图 2.51 所 示 ， 白 光照 射 红 色 标 志 ， 红 色 标 志 吸 收 

青色 ， 只 有 红色 光 返 回 ， 在 图 像 中 形成 红色 标志 图 像 。 
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2. 5.6 被 测 物体 的 表面 处 理 


在 待 测 物体 表面 人 工 制作 某 种 纹理 ， 降 低 了 图 像 处 理 的 难度 ， 以 保证 和 提高 影像 识别 与 
摄影 测量 测 性 能 的 工作 ， 称 为 摄影 工作 的 表面 处 理 。 

1) 利用 投影 设备 ， 将 线条 密度 和 线条 粗细 度 适 宜 的 光栅 、 格 网 或 斑纹 图 案 ， 投 影 到 被 
测 物体 表面 ， 以 形成 人 工 纹理 。 

2) 利用 激光 经 纬 仪 ， 将 激光 按 一 定 扫描 规则 投射 到 被 测 物体 上 ， 以 形成 人 工 纹理 。 

3) 按 一 定 间 隔 将 某 种 标志 ， 包 括 回 光 反 射 标志 ， 贴 附 在 被 测 物体 表面 。 一 般 情 况 下 ， 
当 测定 物体 表面 上 有 一 群 密度 足够 的 点 位 时 ， 可 使 用 本 方法 。 

4) 手工 绘制 人 工 纹理 。 


2.6 计算 机 


视觉 测量 计算 机 通过 采集 卡 接口 接收 图 像 并 与 其 他 外 部 设备 相连 ,使 检测 系统 能 够 协调 
工作 。 计 算 机 是 视觉 测量 系统 的 核心 ， 负 责 对 图 像 的 处 理 、 分 析 和 检测 算法 的 解 算 。 计 算 机 
的 图 像 处 理 速度 和 计算 精度 直接 影响 整个 检测 系统 的 实时 性 和 精度 。 在 视觉 测量 系统 中 还 可 
采用 工业 控制 计算 机 或 以 DSP、MCU、FPGA 为 核心 的 般 入 式 系统 。 下 面 对 视 觉 测量 中 涉及 
的 计算 机 硬件 配置 和 数据 通信 接口 进行 简单 介绍 。 

1. 硬件 配置 

(1) 高 速 处 理 器 

由 于 视觉 测量 系统 需 分 析 大 量 的 二 维 图 像 ， 因 此 对 视觉 测量 计算 机 的 核心 架构 、 运 算 能 
力 和 吞吐 量 有 较 高 的 要 求 ， 以 满足 实时 性 。 一 些 为 图 像 特 别 优化 过 的 专用 CPU， 如 图 像 处 理 
ASIC 芯片 、 高 速 DSP 和 支持 多 媒体 加 速 指令 的 CPU 等 都 是 视觉 测量 的 优选 。 

(2) 大 容量 存储 器 

视觉 测量 系统 采集 的 图 像 信息 的 数据 量 很 大 ， 一 幅 标 准 清晰 度 的 图 像 有 1MB 的 信息 量 ， 
而 lmin 长 的 未 压缩 录像 ， 信 息 量 达 到 2CB。 因 此 ， 视 觉 测量 中 的 工业 控制 计算 机 必须 配备 
大 容量 的 内 存 和 外 部 存储 器 。 大 容量 的 内 存 有 利于 通过 存储 器 直接 处 理 整 幅 图 像 。 

(3) 丰富 的 外 部 接口 

为 了 适应 不 同 摄像 机 的 连接 ， 视 觉 测量 系统 的 计算 机 应 配置 相应 的 数据 通信 接口 。 当 采 
用 数字 摄像 机 时 ， 计 算 机 需要 具有 诸如 IEEE 1394 的 数据 通信 接口 。 

2. 数据 通信 接口 

(1) PCI 总 线 和 PC104 总 线 

PCI 总 线 是 计算 机 的 一 种 标准 总 线 。PCI 总 线 的 地 址 总 线 与 数据 总 线 是 分 时 复 用 的 ， 
方面 可 以 节省 插件 的 引 角 数 ， 另 一 方面 便于 实现 突 发 数据 传输 。 一 些小 型 工控 机 没有 提供 
PCI 插 模 ， 而 是 提供 了 一 个 工控 机 所 特有 的 104 脚 插座 ， 被 称 为 “PC104” 接口 ， 其 功能 模 
仿 了 PCI 的 功能 。 常 用 的 PCI 接口 图 像 采 集 卡 都 有 对 应 的 PC104 接口 产品 。 

(2) IEEE1394 通信 接口 

IEEE1394 接口 英文 也 叫做 Firewrite 接口 。 该 接口 最 快 传输 速率 达到 400Mbit/s。 
IEEE1394b 标准 达到 的 传输 速率 更 高 ， 是 新 一 代 高 性 能 串 行 总 线 标准 。IEEE1394 的 主要 性 
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能 特点 如 下 : 

1) 数字 接口 ”数据 以 数字 形式 传输 ， 不 需 A-D 转换 ， 从 而 降低 了 设备 的 复杂 性 ， 保 证 
了 信号 的 质量 。 

2) 热 插 拔 ”系统 全 速 工作 时 ，IEEE1394 设备 也 可 以 插入 或 拆除 。 

3) 即 插 即 用 ”无需 设 定 ID (识别 符 ) 或 终端 负载 ， 主 节点 可 以 动态 确定 。 

4) 兼容 性 好 ”IEEE1394 总 线 可 适应 计算 机 用 户 的 全 部 VO 要 求 ， 并 可 以 与 SCSI 标准 
并 口 、RS232 标准 串口 、IEEE1284 标准 并 口 、Centronics 接口 、Apple”s Desktop Bus 等 接口 
兼容 。 

5) 接口 设备 对 等 ”部 分 主 从 设备 ， 都 是 主导 者 和 服务 者 。 

(3) Camera Link 通信 接口 

Camera Link 是 在 Channel Link 技术 基础 上 发 展 出 来 一 种 视频 信号 传输 接口 。Camera 
Link 协议 以 低 电 压 差分 信号 (Low Voltage Differential Signaling，LVDS) 传输 规范 为 基础 ， 是 
一 类 性 能 最 高 的 数字 摄像 机 接口 标准 。 与 IEEE1394 不 同 ，Camera Link 每 条 总 线 上 只 允许 有 
一 台 摄 像 机 ,但 计算 机 可 以 容纳 多 条 Camera Link 总 线 。Camera Link 可 在 并 行 组 合 的 单 向 链 
路 、 串 行 链 路 和 点 对 点 链 路 上 利用 串 行 化 / 解 哩 行 化 〈Serializer/Deserializer，SERDES) 技术 
实现 高 达 4. 8Gbit/s 的 传输 速率 来 发 送 数据 。 同 时 ， 每 条 链 路 通过 两 根 导 线 的 LVDS 技术 可 
传送 来 自 7 个 通道 的 数据 ， 且 通道 的 数目 决定 了 Camera Link 总 线 的 最 大 数据 速率 。 一 条 配 
置 齐全 的 总 线 可 以 有 76 个 通道 ， 其 中 包括 11 条 链 路 和 22 根 连 线 。 实 际 上 该 标准 已 经 具有 
28 个 通道 和 56 个 通道 的 总 线 (4 条 或 8 条 链 路 和 8 根 或 16 根 连 线 ) 。 每 条 Camera Link 总 线 
通常 需要 计算 机 的 一 个 独立 接口 卡 。 选 用 Camera Link 总 线 还 必须 涉及 编写 额外 的 软件 程序 。 

(4) USB2. 0 接口 

USB2. 0 的 通信 速率 由 USB1.0 的 12Mbit/s 提高 到 480Mbit/s， 超 过 了 IEEE1394 的 通信 
速率 ， 初 步 具 备 了 全 速 传输 数字 视频 信和 号 的 能 力 。 因 此 ， 市 场 上 出 现 了 大 量 采用 USB2. 0 接 
口 的 摄像 机 。USB 接口 简单 、 即 插 即 用 ， 有 大 量 的 计算 机 软件 支持 USB 摄像 机 的 采集 。 由 
于 USB 是 一 个 家 用 标准 ， 因 此 大 多 数 USB 摄像 机 用 于 网 络 聊天 或 家 用 摄像 。USB 物理 接口 
的 抗 干 扰 能 力 较 差 ， 体 系 结构 中 存在 复杂 的 主 从 关系 ， 没 有 同步 实时 的 保证 ， 因 此 目前 USB 
摄像 机 一 般 不 用 于 视觉 检测 。 

(5) 串 行 接口 

大 多 数 工 控 机 除 具有 RS232 串 行 接口 外 ， 还 具有 RS485 和 RS422 串 行 接口 ， 因 此 可 以 
很 方便 地 与 工业 现场 设备 和 摄像 机 通信 。 有 的 模拟 摄像 机 提供 串 行 接口 ， 用 来 修改 内 部 参数 
和 对 镜头 进行 变焦 、 调 节 光 圈 等 操作 ， 弥 补 了 模拟 摄像 机 不 可 远程 自动 控制 的 缺点 。 而 对 于 
数字 摄像 机 ， 这 些 操作 直接 通过 采集 信道 上 的 控制 命令 来 完成 。 













































































第 3 音 图 像 巴 处理 


图 像 预 处 理 是 视觉 测量 系统 中 的 重要 组 成 部 分 ， 其 主要 目的 是 改善 图 像 的 质量 ， 主 要 内 
容 包括 图 像 滤波 和 图 像 增 强 。 即 去 除 图 像 中 的 噪声 ， 或 者 针对 具体 应 用 ， 对 原始 图 像 进行 某 
种 处 理 ， 从 而 突出 某 些 信息 等 。 本 章 主要 从 图 像 滤 波 和 图 像 增强 的 角度 介绍 图 像 预 处 理 常 用 
的 一 些 基 本 方法 : 空间 域 和 频 域 图 像 平滑 方法 、 图 像 增强 的 直接 灰 度 变换 、 直 方 图 均衡 化 、 
同 态 滤 波 与 空间 域 和 频 域 图 像 锐 化 方法 等 。 其 中 ， 空 间 域 和 频 域 图 像 平 滑 方法 采用 低 通 滤波 
器 实现 ， 其 目的 是 去 除 图 像 中 的 噪声 或 提取 较 大 目标 前 去 除 较 小 的 细节 和 将 目标 内 的 小 的 间 
断 连 接 起 来 。 图 像 增 强 的 目的 是 使 图 像 细 节 更 加 清晰 。 图 像 锐 化 也 是 一 种 图 像 增强 ， 一 般 采 
用 高 通 滤波 器 实现 ， 其 目的 是 增强 边缘 等 高 频 信 息 和 模糊 细节 。 在 实际 应 用 中 ， 可 以 根据 需 
求 选择 相应 的 预 处 理 方法 ， 或 者 将 多 种 预 处 理 方法 综合 起 来 运用 。 


3.1 概述 


图 像 预 处 理 是 计算 机 视觉 系统 必 不 可 少 的 组 成 部 分 。 根 据 图 像 预 处 理 过 程 所 处 的 空间 不 
同 ， 可 以 将 图 像 预 处 理 方法 分 为 空间 域 图 像 预 处 理 方法 与 变换 域 图 像 预 处 理 方法 。 所 谓 空间 
域 图 像 预 处 理 方法 (以 下 简称 为 空间 域 法 ) 就 是 在 原 图 像 所 在 的 二 维 空间 里 直接 对 像素 的 灰 
度 值 进行 各 种 处 理 ， 例 如 利用 均值 滤波 器 将 包含 某 点 的 一 个 小 区 域内 各 点 的 灰 度 平均 值 代替 
该 点 的 灰 度 值 。 空 间 域 法 的 基本 原理 如 图 3. 1 所 示 ， 即 

g(x,y) = TLf(x,y)] (3.1) 
式 中 ,f(x，y) 为 预 处 理 前 的 二 维 图 像 ，g(x，y) 为 预 处 理 后 的 二 维 图 像 ，7(. ) 为 空间 域 预 
处 理 函数 。 

变换 域 图 像 预 处 理 方法 (以 下 简称 为 变换 域 法 ) 是 对 定义 在 某 “yt 一-[7o| -se 
一 图 像 空间 的 图 像 以 某 种 形式 转换 到 另 一 个 图 像 空间 的 图 像 ， 并 
利用 这 些 空间 里 的 特有 性 质 对 变换 后 的 系数 进行 相应 的 处 理 ， 然 ”图 3.1 空间 域 法 原理 
后 将 处 理 结果 反 变换 回 图 像 空 间 ， 从 而 得 到 所 需 的 效果 ， 即 达到 图 像 平 滑 、 对 比 度 调整 或 图 
像 锐 化 等 预 处 理 目的 。 变 换 域 法 是 一 种 间接 的 处 理 方法 ， 其 基本 原理 如 图 3. 2 所 示 。 

图 3.2 中 ,有 (p，9) 表 未 图 jy 一 | E 朗 换 | 和 人 [修正 Rp | 全 | 友 变 绵 |g G2) 
像 Kx，y) 的 变换 域 正 变换 数据 ; 
GC(p，g) 表示 变换 域 修正 后 的 变 国 
换 域 数据 ; g(x，y) 表 示 最 终 的 变换 域 处 理 结果 数据 。 

一 般 情 况 下 ， 变 换 函 数 是 正 交 函数 族 ， 常 用 的 正 交 变 换 有 傅 里 叶 变 换 、 小 波 变 换 、 离 散 
余弦 变换 、Radon 变换 等 。 其 中 ， 傅 里 叶 变换 是 最 经 典 的 正 交 变 换 方法 ， 在 图 像 处 理 领域 中 
占有 重要 的 地 位 。 傅 里 叶 变换 将 图 像 从 空域 变换 到 频 域 ， 因 此 基于 傅 里 叶 变换 的 图 像 预 处 理 
方法 被 称 为 频 域 图 像 预 处 理 方法 。 
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3.2 图像 滤波 


在 数字 图 像 处 理 中 ， 由 于 受到 成 像 方法 的 限制 ， 图 像 中 的 边缘 、 细 节 、 特 征 等 重要 消息 
常 削 没 于 噪声 信号 中 ， 从 而 给 图 像 的 后 续 处 理 ( 如 图 像 分 割 、 图 像 匹 配 等 ) 带 来 很 大 的 影响 。 
由 于 噪声 对 图 像 的 影响 是 无 法 避免 的 ， 因 此 对 含 噪声 图 像 进行 适当 处 理 是 图 像 预 处 理 中 的 重 
要 问题 。 减 轻 或 消除 图 像 噪声 的 处 理 方法 被 称 为 图 像 平 滑 或 图 像 滤 波 ， 简 称 为 平滑 或 滤波 。 

由 于 图 像 在 采集 、 传 输 、 显 示 等 过 程 中 会 受到 不 同类 型 噪声 的 影响 ， 而 某 种 图 像 滤 波 方 
法 一 般 是 针对 某 种 类 型 的 噪声 而 提出 的 ， 因 此 在 熟悉 图 像 滤 波 方法 的 同时 ， 应 该 对 图 像 噪声 
类 型 有 一 定 的 了 解 。 


3.2.1 图 像 噪声 类 型 


图 像 中 噪声 的 种 类 很 多 ， 对 图 像 信号 幅度 和 相位 的 影响 十 分 复杂 ， 有 些 噪声 和 图 像 信号 
互相 独立 不 相关 ， 有 些 是 相关 的 ， 噪 声 本 身 之 间 有 些 也 相关 。 噪 声 一 般 都 是 不 可 预测 的 随机 
信号 ， 只 能 用 概率 统计 的 方法 去 认识 。 统 计 特 性 不 随时 间 变 化 的 噪声 称 为 平稳 噪声 ， 而 统计 
特性 随时 间 变 化 的 噪声 被 称 为 非 平 稳 噪声 。 
引起 噪声 的 原因 很 多 ， 有 传感器 或 电子 元 器 件 内 部 电子 的 随机 运动 造成 的 内 部 噪声 ， 电 
顺 内 部 一 些 部 件 的 机 械 振动 导致 电流 变化 或 电磁 场 变化 而 产生 的 噪声 ， 外 部 天 然 电 磁 或 工程 
电磁 通过 大 气 或 电源 线 引 入 系统 内 部 所 产生 的 外 部 噪声 ， 感 光 过 程 中 产生 的 颗粒 噪声 ， 磁 带 
磁盘 表面 缺陷 所 引起 的 噪声 ， 传 输 通道 的 干扰 及 量化 噪声 ， 解 码 误差 产生 的 误差 噪声 等 。 

噪声 产生 的 原因 决定 了 噪声 的 分 布 特性 ， 以 及 它 与 图 像 信 号 的 关系 。 根 据 噪 声 和 信和 号 的 
关系 可 以 将 噪声 分 为 两 种 形式 : 加 性 噪声 与 乘 性 噪声 。 

(1) 加 性 噪声 

加 性 噪声 xz(x，7y) 与 图 像 信 号 g(*，y) 无关 。 含 噪 图 像 /(x，y) 可 以 看 成 是 理想 无 噪 图 
像 与 加 性 噪声 之 和 ， 即 










































































f(x,y) = g(x%,y) + n(x,y) (3.2) 
图 像 传输 过 程 中 的 信道 噪声 及 图 像 扫描 “过 程 中 产生 的 噪声 都 属于 加 性 噪声 。 
(2) 乘 性 噪声 
乘 性 噪声 与 图 像 信 叶 有 关 。 它 又 可 以 分 为 两 种 情况 : 一 种 是 某 像素 点 的 噪声 只 与 该 像素 
点 的 图 像 信 号 有 关 ; 另 一 种 是 某 像素 点 的 噪声 与 该 点 及 其 邻 域 的 图 像 信 号 有 关 。 如 果 噪 声 和 
信号 成 正比 ， 则 含 噪 图 像 f(x，y) 可 以 表示 为 
f(x,y) = g(x,y) +t n(x,y) g(r,y) (3.3) 
电视 图 像 中 的 相干 噪声 及 照片 中 的 颗粒 噪声 都 属于 乘 性 噪声 。 
根据 噪声 所 服从 的 数学 分 布 规律 ， 噪 声 可 以 分 为 高 斯 噪声 、 脉 冲 噪声 、 泊 松 噪声 、 均 匀 
分 布 噪声 等 。 
(1) 高 斯 噪声 
高 斯 噪声 是 指 概率 密度 天 数 服从 高 斯 分 布 ( 即 正 态 分 布 ) 的 一 类 噪声 。 对 于 多 数 应 用 ， 
均 可 用 高 斯 过 程 作为 有 效 的 噪声 模型 ， 因 此 这 种 噪声 模型 经 常 被 用 于 实践 中 。 一 维 高 斯 随机 
变量 x 的 概率 密度 函数 为 
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人 6 (3.4) 
TO 























高 斯 噪声 的 特点 是 密度 大 ， 噪 声 强 度 的 波动 范围 较 宽 。 也 就 是 说 ， 对 于 被 高 斯 噪声 污染 
的 图 像 ， 不 仅 在 图 像 的 每 一 像素 灰 度 级 上 存在 着 影响 ， 并 且 在 同一 像素 灰 度 级 上 造成 的 污染 
程度 也 存在 着 较 大 差异 。 

(2) 脉冲 噪声 

脉冲 噪声 主要 表现 在 成 像 中 的 短暂 停留 ， 如 错误 的 开关 操作 ， 其 概率 密度 函数 为 

Pa T= 
p(x%) = 4p, x = (3.5) 
0 ”其 他 

如 果 >a， 灰 度 值 4 在 图 像 中 将 显示 为 一 个 亮点 ，u 的 值 将 显示 为 一 个 暗 点 。 若 p, =0 
或 记 =0， 则 为 单 极 脉冲 ， 即 正 脉冲 噪声 或 负 脉 冲 噪 声 。 若 p, 和 p, 均 不 为 零 ， 尤 其 是 它们 
近似 相等 时 ， 脉 冲 噪声 值 将 类 似 于 随机 分 布 在 图 像 上 的 胡 概 和 盐 粉 颗粒 。 因 此 双 极 脉冲 噪声 
也 称 为 板 盐 噪声 。 

脉冲 噪声 是 非 连续 的 ， 由 持续 时 间 短 和 幅度 大 的 不 规则 脉冲 或 噪声 尖峰 组 成 。 脉 冲 噪 声 
分 为 正 脉冲 噪声 和 负 脉 冲 噪声 ， 在 图 像 上 表现 为 亮点 和 暗 点 。 椒 盐 噪 声 是 极端 噪声 ， 表 现 为 
黑白 相间 的 亮 暗 点 噪声 。 它 的 分 布 一 般 位 于 像素 亮度 的 最 亮 区 或 最 暗 区 ， 与 周围 像素 亮度 存 
在 较 大 的 差别 ， 在 噪声 密度 不 是 很 大 的 条 件 下 ,易于 定位 和 滤 除 。 

(3) 泊 松 噪声 

泊 松 分 布 噪声 的 概率 密度 函数 为 
























































x_—A 
A'e 





p(x%) = (3.6) 


x! 
式 中 ，A >0。 光 电子 噪声 是 由 光 的 统计 本 质 和 图 像 传 感 磊 中 光电 转换 过 程 引 起 的 。 在 弱 光 
照 的 情况 下 ， 其 影响 更 为 严重 ， 此 时 常用 具有 泊 松 分 布 的 随机 变量 作为 光电 噪声 的 模型 。 这 
种 分 布 的 标准 差 等 于 均值 的 平方 根 。 在 光照 较 强 时 ， 泊 松 分 布 趋向 于 高 斯 分 布 ， 而 标准 差 仍 
等 于 均值 的 平方 根 。 这 意味 着 噪声 的 幅度 是 与 信号 有 关 的 。 对 于 一 般 的 图 像 复 原来 说 ， 这 种 
对 信和 号 的 依赖 性 可 以 忽略 不 计 ， 但 是 在 要 求 高 精度 的 情况 下 ， 必 须 加 以 考虑 。 大 型 工业 CT 
图 像 处 理 、 天 文 固态 光电 检测 器 阵列 、 自 催化 光化学 反应 成 像 中 经 常 存 在 着 泊 松 分 布 的 噪 
声 。 

(4) 均匀 分 布 噪声 

均匀 分 布 噪声 的 概率 密度 函数 为 


p(x%) = | 

















l/(b-a) a<x<b 
0 其 他 
概率 密度 函数 的 期 望 值 和 方差 分 别 是 u = 全 着 2 均匀 分 布 的 噪声 在 实践 中 最 

为 少见 ， 它 常常 用 来 作为 随机 数 发 生 咒 。 

大 量 实验 研究 发 现 ， 由 摄像 机 拍摄 得 到 的 图 像 受 离散 的 脉冲 、 椒 盐 噪声 和 零 均 值 的 高 斯 
噪声 的 影响 严重 。 品 声 给 图 像 处 理 带 来 很 多 困难 ， 对 图 像 分 割 、 图 像 特征 提取 、 图 像 识别 等 
具有 直接 影响 。 因 此 ， 实 时 采集 的 图 像 需 进 行 滤波 处 理 。 消 除 图 像 中 的 噪声 成 分 叫做 图 像 的 


(3.7) 
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平滑 化 或 滤波 操作 。 对 滤波 处 理 的 要 求 有 两 条 : 一 是 尽 可 能 不 损坏 图 像 轮廓 及 边缘 等 重要 信 
息 ; 二 是 使 图 像 清晰 ， 改 善 视觉 效果 。 


3.2.2 空间 域 滤波 


空间 域 滤波 即 直 接 在 图 像 空 间 中 进行 滤波 操作 ， 空 域 滤波 有 时 借助 变换 域 实现 。 例 如 ， 
线性 系统 的 转移 函数 和 脉冲 函数 或 点 扩散 函数 构成 傅 里 叶 变 换 对 ， 所 以 线性 系统 滤波 器 的 设 
计 常 借助 于 传 里 叶 变 换 分 析 ， 即 在 频 域 完成 滤波 器 的 设计 ， 然 后 反 变 换 回 空间 域 构造 滤波 器 
模板 ， 采 用 滤波 器 模板 卷 积 图 像 实现 滤波 操作 。 

空间 域 滤 波 是 在 图 像 空 间 借 助 模板 进行 邻 域 操作 完成 的 ， 即 在 待 处 理 图 像 中 逐 点 移动 模 
板 。 在 每 一 点 (x，y) 处， 滤波 器 在 该 点 的 响应 通过 事先 定义 的 关系 进行 计算 。 

空间 域 滤波 分 为 线性 空间 域 滤 波 和 非 线 性 空间 域 滤波 。 线 性 空间 域 滤 波 借助 模板 与 网 像 
进行 卷 积 并 在 邻 域 操 作 。 非 线性 空间 域 滤波 则 直接 在 邻 域 操 作 。 

1. 线性 空间 域 滤 波 

线性 空间 域 滤波 是 一 种 对 高 斯 噪声 有 效 的 滤波 方法 。 它 借助 模板 (也 称 为 掩 模 、 卷 积 核 
或 滤波 器 ) 与 图 像 进行 卷 积 来 实现 。 线 性 空域 滤波 的 模板 的 系数 和 为 1， 在 图 像 平 坦 区 域 模 
板 输出 与 原 值 相同 ， 具 有 低 通 滤波 的 特性 。 在 图 像 的 每 一 点 (x,y) 处 ,计算 模板 与 所 履 羡 
图 像 区 域 的 线性 输出 响应 ， 并 将 响应 结果 赋予 模板 所 覆盖 区 域 中 心 的 像素 值 。 

假设 模板 下 的 大 小 为 m xn， 图 像 的 大 小 为 MxN， 线 性 空间 域 滤 波 的 主要 操作 过 程 
可 以 描述 如 下 : 

1) 将 模板 在 图 像 中 漫游 ， 遍 历 图 像 中 每 个 像素 ， 并 将 模板 中 心 与 图 像 中 某 个 像素 位 置 
重合 。 图 3. 3 给 出 了 一 个 用 3 x3 模板 进行 图 像 遍历 滤波 的 示例 。 


































































































16 11 10 16 24 40 51 61 
模板 | 12 i12 1 14 119] 26 58 60 55 模板 所 覆盖 的 

| 像素 区 域 

| 241 40 57 69 56 

和 22 1291 12 | 14 |19 

模板 中 心 U7122129| 51 87 80 62 a 

18 22 37 56 68 109 103 77 13 16 | 24 
24 35 55 64 81 104 113 92 17|212 
49 64 78 87 103 121 120 101 
72 9% 95 98 112 100 103 99 

了 

a) b) 
































图 3.3 用 3 x3 模板 进行 图 像 遍历 滤波 的 示例 
2) 将 模板 系数 ( 见 图 3.4b ) 与 模板 所 覆盖 区 域 的 对 应 像素 (其 位 置 编号 如 图 3. 4a 所 示 ) 
相 乘 并 将 所 有 乘积 相 加 ， 即 可 按照 下 式 计算 模 板 下 在 图 像 (x，y) 人 处 的 响应 ; 


t=b s=a 


R(x,y) = 之 > Ws + ssy +) (3.8) 


式 中 ,a =(m-1)/2，b=(n-1)/2,，a、。 为 非 负 整数 。 一 般 情 况 下 ， 模 板 的 长 和 宽 都 是 奇 
数 ， 其 有 意义 的 最 小 尺寸 为 3x3。 为 了 保证 在 无 噪声 区 域 模板 卷 积 的 输出 保持 图 像 原 值 不 
变 ， 斑 (s, 1) 应 该 满足 如 下 的 归 一 化 条 件 : 
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了 之 wsD =1 (3.9) 
3) 将 RCx， 们 赋 给 去 噪 后 所 得 新 图 像 中 (*，y ) 位 置 的 像素 值 g(z，y) ， 如 图 3 4c 所 


不 。 





a) 模板 所 覆盖 的 图 像 b) 模板 系数 9) 滤波 后 的 图 像 赋值 





图 3.4 ”线性 空间 域 滤波 的 模板 及 所 覆盖 像素 位 置 

根据 模板 系数 的 不 同 ， 可 以 将 线性 空间 域 滤 波 分 为 均值 线性 空间 域 滤 波 ( 以 下 简称 为 均 
值 滤波 ) 与 加 权 均 值 线 性 空间 域 滤波 (以 下 简称 为 加 权 均 值 滤波 ) 两 种 。 其 中 ， 均 值 滤波 带 中 
的 各 个 模板 系数 完全 相同 ， 而 加 权 均 值 滤波 器 中 各 个 模板 系数 依据 离 模板 中 心 的 远近 而 不 
同 。 

【 例 3.1】 均值 滤波 器 使 用 实例 

均值 滤波 器 模板 系数 相等 ， 且 和 为 1。 其 输出 响应 是 包含 滤波 模板 邻 域内 像素 的 平均 
值 ， 即 用 滤波 模板 确定 的 邻 域内 像素 的 灰 度 平均 值 去 代替 图 像 中 每 个 像素 点 的 值 。 

图 3. 5a 所 示 为 一 个 3 x3 的 均值 滤波 器 ， 将 其 应 用 于 图 3. 4a 的 子 图 像 ， 其 滤波 结果 为 


gz) = 可 (zy) + fxsy +1) + -1y+ID YN + ~ 1,y -1), 
fxsy -IT) + -1,y) +fx +1,y) +f(x +1,y +1)) 
,了 DA ryt) 

对 于 与 图 3.3b 所 示 模板 对 应 的 像素 区 域 ， 采 用 图 3. 5a 所 示 的 滤波 器 进行 滤波 ， 其 结果 


| | 
g(2,2) = 2 fxrtisy t+)) = (12 +14+19 +13 +16+24+17 +22 +29) 


均值 滤波 带 减 小 了 图 像 灰 度 的 “尖锐 ”变化 。 由 于 图 像 边 缘 也 是 图 像 中 灰 度 剧烈 变化 的 
地 方 ， 因 此 在 滤波 过 程 中 均值 滤波 处 理会 使 图 像 边 缘 产 生 一 定 的 模糊 。 均 值 滤 波 主 要 关注 的 
是 模板 的 形状 和 尺度 ， 而 不 是 模板 系数 。 

【 例 3.2】 加 权 均 值 滤波 器 使 用 实例 

与 均值 滤波 圳 相 比 ， 加 权 均 值 滤波 天 的 模板 系数 可 以 不 同 ， 但 其 模板 系数 之 和 仍 为 1。 
一 般 来 说 ， 距 离 模板 中 心 越 远 ， 横 板 系数 越 小 。 也 就 是 说 ， 在 计算 图 像 中 某 点 的 新 像素 值 
时 ， 处 于 模板 中 心 位 置 的 像素 比 其 他 任何 像素 的 作用 都 要 大 。 加 权 均 值 模板 可 以 有 效 减 小 平 
滑 处 理 中 国 像 边 缘 的 模糊 效应 。 

图 3. 5b 给 出 了 一 个 加 权 均 值 滤波 器 ， 将 其 应 用 于 图 3. 4a 中 的 子 图 像 ， 则 模板 的 输出 响 
应 为 
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g(xX,y) = [4 xf(x,y) +2 xflx,y +1)+1l xf(x-1,y+1)+2xf/(x-1,y)+ 


1 xf(x—-1,y-1) +2 xf(x,y -1)+1l xf/(x+1,y-1)+ 
2 xf(x+1,y) +1l xf(x+1,y+1)] 
对 于 图 3. 3b 中 模板 所 对 应 的 像素 区 域 , 采用 图 3. Sb 所 示 的 加 权 均 值 滤 波 器 进行 滤波 ， 
其 结果 为 


g(2,2) = (1 X12 +2x14+1x19 +2x13 +4x16+2x24+ 


lx17+2x22+1 x29) = 18 




















2. 非 线性 空间 域 滤波 1 | 1 1|2|1 

线性 空间 域 滤波 可 以 有 效 地 去 除 高 斯 噪声 ， 但 在 消 1 四 加 x 2 
除 噪声 的 同时 也 会 使 图 像 中 的 一 些 细节 变 得 模糊 。 很 多 ul | 
情况 下 ， 图 像 中 的 一 些 噪声 点 通常 比 非 噪 声 点 的 像素 更 。 ” 驯 均 值 滤波 器 。 ”b) 加 权 均 值 滤波 器 
亮 或 更 暗 ， 可 以 用 脉冲 噪声 或 椒盐 噪声 来 描述 。 这 时 如 图 3.5 两 个 3 x3 的 滤波 器 
果 在 噪声 点 像素 周围 寻找 一 个 合理 的 数值 对 它 进行 代 
替 ， 在 一 定 程 度 上 可 以 获得 较 理 想 的 滤波 结果 。 中 值 滤波 、 最 大 值 滤波 和 最 小 值 滤波 等 都 是 
基于 上 述 思想 进行 滤波 的 算法 ， 它 们 都 是 典型 的 非 线性 滤波 方法 。 非 线性 空间 域 滤 波 器 能 
较 好 地 处 理 椒盐 噪声 、 脉 冲 噪 声 和 抓 立 噪声 点 。 非 线性 空间 域 滤 波 的 一 般 操作 步骤 如 下 : 

1) 将 模板 在 图 中 漫游 遍历 图 像 中 每 个 像素 ， 并 将 模板 中 心 与 图 像 中 某 个 像素 位 置 重 
人 入 

2) 读 取 模板 下 一 个 对 应 像素 的 灰 度 值 。 

3) 将 这 些 灰 度 值 从 小 到 大 排 成 一 列 。 

4) 找 出 这 些 值 里 排 在 中 间 的 某 一 个 值 。 

5) 将 这 个 中 间 值 赋 给 对 应 模板 中 心 位 置 的 像素 。 

(1) 中 值 滤波 器 

中 值 滤波 的 基本 思想 是 ， 首 先 确 定 一 个 尺寸 为 奇数 的 m xn 的 模板 下 ,模板 所 履 盖 的 像 
素 按 灰 度 值 从 小 到 大 排序 后 ， 用 中 间 位 置 灰 度 值 代 百 原 灰 度 值 。 因 此 其 基本 步骤 描述 如 下 。 

1) 将 模板 在 图 中 漫游 ， 遍历 图 像 中 每 个 像素 ， 在 每 个 像素 位 置 将 模板 中 心 与 该 像素 重 
合 ， 如 图 3. 3a 所 示 。 

2) 读 取 模板 对 应 的 图 像 子 块 中 每 一 个 像素 的 灰 度 值 。 

3) 将 这 些 灰 度 值 从 小 到 大 排 成 一 列 。 

4) 找 出 这 些 值 里 排 在 中 间 的 值 ， 并 将 这 个 中 间 值 赋 给 对 应 模板 中 心 位 置 的 像素 ， 即 中 
值 滤波 后 的 图 像 在 (x，y) 的 灰 度 值 为 

g(x,y) = median{f(x’,y’)} (3. 10) 

式 中 , x’e[x-m+1, x+m-1]; ye[y-n+1, y+n-1]; m 与 n 为 选 定 的 模板 大 小 。 

通过 上 述 步骤 可 以 看 出 ， 中 值 滤波 需 的 主要 功能 就 是 让 与 周围 像素 灰 度 值 的 差 比 较 大 的 
像素 改 为 与 周围 像素 灰 度 值 接近 的 像素 ， 所 以 它 对 孤立 噪声 像素 的 消除 能 力 很 强 。 由 于 它 不 
是 简单 地 取 平 均 ， 所 以 产生 的 模糊 比较 少 。 换 句 话 说， 中 值 滤波 器 既 能 消除 噪声 ， 又 能 保持 
图 像 的 细节 。 
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【 例 3.3】 中 值 滤波 器 的 使 用 

图 3. 6 所 示 是 利用 3 x3 的 模板 进行 中 值 滤波 的 示例 。 图 3. 6a 所 示 为 图 3. 3 中 模板 所 柳 
盖 的 一 个 图 像 区 域 ， 将 9 个 像素 按照 从 小 到 大 的 顺序 进行 排列 ， 其 排列 结果 如 图 3. 6c 所 示 。 
由 于 17 排 在 中 间 ， 因 此 最 终 模板 中 心 所 对 应 的 像素 f(2, 2 ) 的 值 用 17 代替 ， 即 g(2，2) = 
lls 
































(2) 最 大 值 滤波 器 和 最 小 值 滤 波 器 14 | 19 
中 值 相 当 于 顺序 排列 数值 中 间 的 数 ， 如 果 使 用 排序 | 3 |16 |24 17 
序列 中 最 后 一 个 数值 ， 即 得 到 最 大 值 滤波 器 ， 其 表达 式 |L27 12 129 
为 a) 模板 下 的 图 像 b) 滤波 结果 
g(x,y) = maxlAxz yx elx-m+t+l,x+tm-1], 12<13<14<16<17<19<22<24<29 
y el[y-n+l,y+n-1] (3.11) c) 排列 结果 


最 大 值 滤波 器 在 发 现 图 像 中 的 最 亮点 时 非常 有 用 。 困 3 6。 用 3x3 术 板 流 行 中 入流 示例 
因为 “ 衣 椒 "噪声 是 非常 低 的 值 ， 可 以 通过 最 大 值 滤波 央 
消除 “胡椒 ”噪声 。 

选择 排序 序列 中 起 始 位 置 数 值 的 滤波 器 称 为 最 小 值 滤波 咒 ， 其 表达 式 为 

g(x,y) = minlf(x’,y)),x el[x-m+l,x+t+m-1l],y ely-n+l,y+n-1] 

(3. 12) 

最 小 值 滤波 絮 对 发 现 图 像 中 的 最 暗 点 非常 有 用 。 因 为 “ 盐 粉 ”噪声 是 非常 高 的 值 ， 因 此 
可 以 利用 最 小 值 滤波 器 来 消除 “ 盐 粉 噪声 。 

【 例 3.4】 最 大 值 滤波 句 和 最 小 值 滤波 需 使 用 示例 

在 图 3. 6a 所 示 的 图 像 中 ， 若 使 用 最 大 值 滤波 器 ， 由 于 9 个 像素 中 的 最 大 值 为 29， 因 此 
模板 中 心 所 对 应 的 像素 值 应 为 29， 即 g(2, 2) =29。 

同 理 ， 在 图 3. 6a 所 示 的 图 像 中 ， 若 使 用 最 小 值 滤波 器 进行 滤波 ， 由 于 9 个 像素 中 的 最 
大 值 为 12， 因 此 模板 中 心 所 对 应 的 像素 值 应 为 12， 即 a(2, 2) =12。 

(3) 中 点 滤波 器 

中 点 滤波 带 是 在 滤波 器 涉及 范围 内 计算 最 大 值 和 最 小 值 之 间 的 中 点 ， 其 计算 表达 式 为 


g(x,7) = 二 (minlKw 7) + max f(x’,y) |) (3.13) 








式 中 , x’e[x-m+1l, x+m-1]; ye[ly-n+l, y+n-l1]。 

在 图 3. 6a 所 示 的 图 像 中 ， 若 使 用 中 点 滤波 器 ， 由 于 9 个 像素 中 的 最 大 值 为 29， 最 小 值 
为 12， 因 此 滤波 后 模板 中 心 所 对 应 的 像素 的 值 应 为 21( 四 舍 五 入 )。 

由 于 中 点 滤波 器 结合 了 顺序 统计 和 求 平均 ， 因 此 对 于 高 斯 噪声 和 均匀 分 布 噪声 有 较 好 的 
效果 。 

(4) 修正 后 的 阿尔 法 均值 滤波 需 

修正 后 的 阿尔 法 均值 滤波 锅 也 叫 阿尔 法 裁减 均值 滤波 器 。 它 是 结合 均值 滤波 器 和 非 线性 
滤波 需 形 成 的 裁减 滤波 器 ， 对 脉冲 噪声 和 高 斯 噪声 的 混合 噪声 有 效 。 

假设 在 f(x，y) 令 域内 去 掉 4/2 个 具有 最 高 灰 度 值 的 像素 和 4d/2 个 具有 最 低 灰 度 值 的 像 
素 ， 用 f(x，y) 代 表 剩 余 的 mn - d 个 像素 。 由 这 些 剩 余 像素 点 的 平均 值 形成 的 滤波 器 称 为 
修正 后 的 阿尔 法 均值 滤波 带 ， 其 表达 式 为 
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gx, 1) = 一 (Cs (3. 14) 

式 中 ,4d 值 可 以 取 0 到 mn -1 之 间 的 任意 数 。 

当 d=0 时 ,修正 后 的 阿尔 法 均值 滤波 器 变 为 算术 均值 滤波 器 。 

当 d=(mn -1)Z2 时 ， 修 正 后 的 阿尔 法 均值 滤波 器 将 变 为 中 值 滤波 器 。 

在 图 3. 6a 所 示 的 图 像 中 ， 知 使 用 修正 后 的 阿尔 法 均值 滤波 器 进行 滤波 ,假设 4=4， 去 
掉 两 个 最 大 值 (29 和 24) ， 两 个 最 小 值 (12 和 13 ) ， 取 剩 下 五 个 像素 的 均值 作为 模板 中 心 像 
素 的 最 终 灰 度 值 ， 即 g(2，2) =(14+16+17+22 +24)/5 =19( 四 售 五 人 ) 。 

3. 应 注意 的 问题 

应 用 空间 域 滤波 法 进行 图 像 平 滑 时 要 注意 以 下 两 个 问题 : 模板 尺寸 的 选取 与 边界 处 理 。 

模板 尺寸 与 平滑 效果 直接 相关 。 一 般 而 言 ， 模 板 越 大 ， 平滑 效 果 越 好 ， 但 会 造成 图 像 边 
缘 信息 的 损失 。 因 此 ， 模 板 的 大 小 应 该 在 保证 消除 噪声 的 前 提 下 尽 可 能 地 保持 图 像 的 边缘 信 
息 。 在 实际 应 用 中 ， 模 板 尺寸 一 般 设 定 为 奇数 ， 且 不 超过 11 x11， 可 以 选择 3 x3、5 x5、7 
x7 等 。2 x2 的 模板 有 时 也 会 用 到 ， 此 时 模板 与 所 覆盖 的 像素 位 置 关系 如 图 3.7 所 示 。 



































eg@g@ @ 
@ @ @ @ 
@ @ @ @ 
eg@g@ @ 
a)2X2 的 模板 覆盖 的 区 域 b)2X2 的 模板 


c) 模 板 所 覆盖 的 图 像 像素 d) 模 板 系数 e) 均 值 滤波 器 模板 系数 
图 3.7 2 x2 的 模板 








此 时 ， 其 滤波 右 响 应 输出 为 
wry) = WO ly Wf a 六 
W(0,1) xf(x +1,y) + W(0,1) xf(x +1,y) + W(O0,1) xf(x,y +1) 
(3. 15) 
实现 空间 滤波 邻 域 处 理 时 的 另 一 个 重要 考虑 因素 是 边界 处 理 ， 即 当 滤 波 中 心 靠近 图 像 边 
界 时 如 何 进行 计算 。 考 虑 一 个 简单 的 大 小 为 nxn 的 方形 模板 ， 当 模板 中 心 距离 图 像 边 缘 为 
(n -1)72 个 像素 时 ， 该 模板 至 少 有 一 条 边 与 图 像 边界 重合 。 如 果 模 板 中 心 继续 向 图 像 边界 
靠近 ， 那 么 模板 的 行 或 列 就 会 处 于 图 像 平面 之 外 。 对 于 这 个 问题 一 般 有 如 下 处 理 方 法 : 
1) 将 模板 中 心 点 的 移动 范围 限制 在 距离 图 像 边界 不 小 于 (n -1)/2 个 像素 处 。 这 种 方法 
处 理 后 的 图 像 比 原始 图 像 略 小 。 但 滤波 后 的 图 像 中 的 所 有 像素 点 都 由 整个 模板 处 理 。 
2) 用 全 部 包含 于 图 像 中 的 模板 部 分 滤波 所 有 像素 。 通 过 这 种 方法 ， 处 理 后 的 图 像 的 大 
小 与 原始 图 像 尺 寸 大 小 一 致 。 靠 近 边界 部 分 的 像素 带 将 用 部 分 滤波 模板 来 处 理 。 
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3) 在 图 像 边 界 以 外 ， 再 补 上 一 行 和 一 列 灰 度 为 零 的 像素 点 ， 其 灰 度 也 可 以 为 其 他 常 值 ， 
或 者 将 边界 复制 补 在 图 像 之 外 。 补 上 的 部 分 经 过 处 理 后 去 除 ， 保 持 处 理 后 图 像 与 原始 图 像 尺 
才 大 小 相等 。 但 是 补 在 靠近 图 像 边 缘 的 部 分 会 带 来 不 良 的 影响 。 这 种 影响 随 着 模板 尺寸 的 增 
加 而 增 大 。 


3.2.3 ”变换 域 滤波 


如 前 所 述 ， 变 换 域 图 像 处 理 就 是 将 图 像 从 空间 域 转换 到 变换 域 ， 然 后 在 变换 域 中 进行 某 
些 操作 和 处 理 ， 再 将 处 理 结果 反 变 换 到 空间 域 ， 从 而 得 到 效果 改善 的 图 像 。 这 种 变换 一 般 是 
线性 变换 ， 且 要 求 可 道 ， 并 满足 一 定 的 正 交 条 件 。 变 换 域 滤波 ， 即 首先 对 图 像 进 行 傅 里 叶 变 
换 、 小 波 变换 等 图 像 变换 ， 然 后 对 变换 系数 进行 操作 ， 最 后 对 经 过 滤波 处 理 的 变换 系数 进行 
反 变换 完 成 滤波 功能 。 在 变换 域 滤波 中 ， 最 基本 的 变换 是 傅 里 叶 变 换 。 它 可 以 将 信号 从 时 域 
或 空间 域 变 换 到 频 域 中 进行 处 理 。 因 此 ， 采 用 传 里 叶 变换 进行 的 图 像 滤波 技术 被 称 为 频 域 滤 
波 。 频 域 滤波 在 信号 处 理 中 有 着 非常 重要 的 地 位 。 


3.3 频 域 滤波 










































































本 节 首 先 简单 介绍 傅 里 叶 变换 的 相关 知识 ， 然 后 介绍 如 何在 频 域 中 进行 滤波 处 理 。 
3. 3.1 一 维 离散 传 里 叶 变 换 


若 以 Ax 为 采样 间隔 ， 对 连续 函数 ,Ax) 进行 等 间隔 采样 ， 将 得 到 N 个 离散 的 函数 值 
[x0) f(xo + Ax), f(xo +2Ax)，…, f(xo +(N-1)Ax))。 其 中 ,每 一 个 函数 值 称 为 f(x) 
的 一 个 样本 。 为 了 表示 方便 ， 表 示 为 

f(x) = f(xo + xAx) (3.16) 
式 中 , x 的 取 值 为 离散 值 0, 1,，…, N -1。 
那么 被 采样 的 单 变量 离散 函 pe ) 的 傅 里 叶 变 换 为 


F(u) = DO nH w=0,1,2,…,M-1 (3. 17) 


式 中 ，j 为 虚数 单位 ; zx 为 天 率 变量 ， 空间 域 几 x*) 经 式 (3.17) 变换 后 所 得 到 的 空间 称 为 函数 
的 频 域 空间 ( 简称 频 域 ) 。 为 了 计算 F(u) ， 首 先 在 指数 项 中 代入 wu =0， 然 后 将 所 有 x 相 加 。 
楼 下 来 在 指 数 项 中 代入 wu =1， 重 复 对 所 有 x 相 加 。 对 所 有 M 个 二 值 重复 这 一 过 程 ， 可 以 获 
得 完整 的 离散 傅 里 叶 变 换 ( Discrete Fourier Transform，DFT) 。 用 离散 傅 里 叶 变 换 可 求 出 与 M 
个 采样 点 对 应 的 内 个 频 域 点 。 即 ， 取 值 为 - M/2 ~ M/2， 可 以 得 到 关于 原点 轴 对 称 的 频谱 。 
如 取 值 范围 为 0 ~ 戏 ， 则 取 正 方向 频率 。 
若 已 知 (wu)， 则 可 以 利用 离散 健 里 叶 反 变换 得 到 原 函 数 f(x) ， 


M-1 


f(x) = 2 Fe i x=0,1,2,.…,M-1 (3. 18) 


式 (3.17) 和 式 (3. 18) 寺 共同 构成 一 个 离散 傅 里 叶 变 换 对 。 变量 ww 有 相似 的 解释 ，F(u) 序列 一 
般 从 0 频率 开始 。 因 此 ,uw 值 序列 为 {0，Au，2Au，…，[M-1]Au} 。F(u) 理 解 为 































































































= (3. 19) 
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式 中 ,=0,， 1，…，M -1。 变 换 前 的 1ZM 乘 数 有 时 放 在 反 变换 前 。 有 时 变换 和 反 变 换 都 乘 
以 由 全 里 时 变换 可 得 w=0 pe 
F(0) = 一 SA ) (3. 20) 


可 见 (0) 是 fx) 的 平均 值 ， 因 此 eg 
在 一 维 离散 傅 里 叶 变换 中 ， 时 域 的 采样 频率 Ax 和 频 域 的 采样 频率 Au 的 关系 为 
1 
MAx 


一 个 实 函 数 的 一 维 离散 传 里 叶 变 换 通 常 是 复数 ， 一 维 离 散 傅 里 叶 变 换 可 以 用 极 坐 标 形式 
表示 为 

















Au = 





(3.21) 




















Fl(u) = Re(u) + ilm(u) (3 22) 
式 中 ，Re(vz) 和 Im(z) 分 别 是 Ru) 的 实 部 和 虚 部 。 利 用 欧 拉 关系 可 以 将 式 (3. 22 ) 表示 为 极 
坐标 形式 ， 即 





Flu) =| F(u) | et'® (3. 23) 

式 中 
| F(u) | = [Ru) + Pu) 1 (3. 24) 
pb(u) = arctan ete) (3. 25 ) 



































其 中 ，1 F(w) | 被 称 为 传 | | 中 (xz) | 被 称 为 傅 里 时 变 
换 的 相 角 或 相位 谱 。 幅 度 谱 与 相位 谱 统称 为 信号 的 频谱 。 谱 的 二 次 方 被 称 为 功率 ( 功率 谱 ， 
能 量 谱 ) ， 其 定义 为 














Plu) = Fr(u) = Ru) + (u) (3. 26) 

信和 号 分 析 中 的 “ 谱 密 度 " 也 是 指 功率 谱 。 

【 例 3.5】 傅 里 叶 变换 实例 

图 3.8 给 出 了 一 个 村 个 点 离散 函数 /(x) 及 其 一 维 离散 傅 里 叶 变 换 幅 度 谱 。 图 3. 8a 所 示 
的 离散 信号 的 非 0 点 个 数 为 K， 图 3. 8b 显示 了 其 侍 里 叶 变 换 的 幅度 谱 | F(u) | ; 图 3.8c 所 
示 的 离散 信和 号 的 非 0 点 个 数 为 2K， 图 3. 8d 显示 其 相应 的 一 维 离散 傅 里 叶 变 换 的 幅度 谱 
| FFCz)1。 

对 于 图 3. 8a 所 示 的 函数 ， 其 傅 里 叶 变 换 为 


mi 7 ee a 
F(u) = 二 = 元 ( 3) We 













































































F(0) = pe 二 0 0 
对 于 图 3. 8c 所 示 的 函数 ， 其 伟 里 叶 变 换 为 


mi 15 ee 5 
F(u) = 3 flx)e* = 二 (> Me)= 和 (> e) 
=0 x=0 大 所 和 

















F(0) = 分 > 2 


从 这 两 个 信号 的 幅度 谱 可 以 看 出 : 
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1) 当 函 数 曲线 下 的 面积 在 * 域 加 倍 时 ， 傅 里 叶 变 换 幅 度 谱 的 高 度 加 倍 。 

2) 当 函 数 的 长 度 加 倍 时 ， 相 同 间隔 下 幅度 为 0 的 频率 点 数量 加 倍 。 

需要 说 明 的 是 ， 如 果 离 散 信号 ALx) 在 变换 前 被 乘 以 ( -1)*， 则 频率 谱 的 中 心 将 被 移动 
到 w=M/2 处 。 





























/0 [FG] AK 
| A 
一 M i 
b 
a) M 个 点 离散 函数 了 (0)， ) ea i 
二 中 人 为 赴 0R 笋 人 
24K 
M 
/0 
4 2K 
M 2 ” = M | 


c) 2K 个 非 0 点 离散 函数 f(x) d) 图 c 对 应 的 离散 函数 传 里 叶 
变换 幅度 谱 


图 3.8 简单 的 1 个 点 离散 函数 所 x) 及 其 一 维 离散 传 里 叶 变 换 幅 度 谱 


3.3.2 二 维 离散 传 里 叶 变 换 


图 像 是 二 维 信号 ， 有 了 一 维 离散 伟 里 叶 变换 的 基础 ， 可 以 很 容易 地 将 其 推广 到 二 维 空 
间 。 一 个 尺寸 为 MxWN 的 图 像 函 数 访 xz，y) 的 离散 传 里 叶 变换 为 


M-1 N-1l 





或 






































Plu) = Wh She 人生 (9 7) 
其 反 变 换 的 表达 式 为 
f(x,y) = 5 FOusw) er 人) (3. 28) 
式 中 , w=0, 1, 2，.…, M-1; v=0, 1, 7, N; x=0, 1, 1, M-1; y=0,1, ,WN 
-1。 
式 (3.27) 和 式 (3.28) 构 成 了 二 维 离散 傅 里 叶 变 换 对 。 其 中 ,变量 xx 和 vw 被 称 为 频率 变 
量 。 





与 一 维 的 情形 一 样 ， 常 量 1/(MN) 位 置 并 不 重要 ， 有 时 它 在 反 变 换 之 前 ， 也 可 以 被 分 为 
两 个 相等 的 常数 1/ VMN， 分 别 乘 在 变换 和 反 变 换 的 式 子 前 。 从 二 维 离散 健 里 叶 变 换 的 式 
(3.27) 可 以 看 出 ， 当 w=0 和 w=0 时 ， ee 


F(0,0) = 而 > /ey) (3. 29) 
OO ee 
率 谱 的 直流 成 分 o 

在 二 维 情况 下 ， 空 间 域 的 采样 间隔 与 频率 域 的 采样 间隔 之 间 的 关系 为 
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1 
Au = 
We (3. 30) 
Ayv 二 NAy 

















二 维 离散 傅 里 叶 变 换 中 的 幅度 谱 、 相 位 谱 、 功 率 谱 的 定义 也 是 一 维 离 散 傅 里 叶 变 换 的 推 








广 。 其 幅度 谱 、 相 位 谱 和 功率 谱 定 义 如 下 : 
| Fl(u,v)| = [Re (u,v) + Im (u,v) 1 (3.31) 
Im(u,v) 
Pp(u,v) arctan | Rav) {3.32) 
Plu,v) =| F(u,v) 1’ = Re (u,v) + Im’ (u,v) (3. 33) 


式 中 ，Re(w, v) 和 Im(wu, 2v) 分 别 是 (u,v) 的 实 部 和 虚 部 。 
3.3.3 ”二 维 离散 傅 里 叶 变 换 的 性 质 


二 维 离 散 健 里 叶 变 换 有 多 种 性 质 ， 这 里 仅 介 绍 三 种 ， 可 分 离 性 、 可 计算 性 及 移 位 性 
(1) 可 分 离 性 
二 维 离 散 侍 里 叶 变 换 为 可 分 离 变 换 ， 二 维 离散 储 里 叶 变 换 可 以 写成 如 下 形式 : 
F(u) = De Sfx pe u = 0,1,.,M;v =0,12…,N (3.34) 



































M-1 _ NN-l a 
fan = Yo yy pu)eY we0le My e002 NN (98) 
u=0 v=0 


(2) 可 计算 性 
由 二 维 离散 傅 里 叶 变 换 的 分 离 形 式 可 知 ， 一 个 二 维 离散 傅 里 叶 变 换 可 由 连续 两 次 运用 一 
维 离散 传 里 叶 变 换 实 现 。 也 就 是 说 ， 二 维 离散 传 里 叶 变 换 可 写 为 


F(x,v) = hfe, Dexp(= i v=0,1,.…,N-1 (3. 36) 


















































F(u,v) = HEF, vw) exp (= = ) u,v =0,1,.…,N-1 (3. 37) 
对 每 个 x 值 ， 式 (3. 37) 是 一 个 一 维 离散 传 里 叶 变 换 ， 所 以 F(x, v) 可 由 沿 f(x，y) 的 每 


一 列 求 变换 得 到 。 在 此 基础 上 ， 对 (x, vw) 每 一 行 求 一 维 离 散 伟 里 叶 变 换 即 得 到 F(w, wv)。 
ii 3.9 表示 。 


四 (N— | Ce 
国 有 一 辆 9 辆 可 


(0,0) (N-1) x (N-1) x (0,0) CD u 


























图 3.9 由 2 步 一 维 离散 傅 里 叶 变 换 计算 二 维 离散 傅 里 叶 变 换 








(3) 移 位 性 
通常 在 二 维 离散 傅 里 叶 变 换 之 前 ， 将 输入 图 像 乘 以 ( -1)*。 由 于 指数 的 性 质 ， 容 易 得 

















到 
FLxy)(-1) 7 = F(u —- M/2,v - N/2) (3. 38) 
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式 (3.38) 说 明 Fx，y)( -1) 的 二 维 离散 傅 里 叶 变 换 的 原点 ， 即 (0,0) 被 设置 在 w= 
M/2、 v=N/2 上。 

换 句 话说 ，( -1)*”? 乘 以 f(x, y) 将 F(u, 2) 的 原点 变换 到 频率 坐标 下 为 [ M/2，N/21]。 
它 是 二 维 离散 传 里 叶 变 换 设置 的 MxN 区 域 的 中 心 。 将 此 频率 域 的 范围 指定 为 频率 矩形， 它 
从 xz=0 到 v=M-1, 从 v=0 到 w=N-1。 为 了 确保 移动 后 坐标 为 整数 ， 要 求 M 和 WN 为 偶 
数 。 当 在 计算 机 中 使 用 二 维 离 散 傅 里 叶 变 换 时 ， 总 和 的 范围 为 (w=0, …, M-1),， (v=0， 
… ,NN--1)。 实 际 的 变换 中 心 将 为 w=M/2+1, v=N/2+1。 


3.3.4 频 域 滤波 的 基本 步骤 

空间 域 和 频 域 之 间 最 基本 的 联系 是 卷 积 计算 。 滤 波 器 作用 于 图 像 ， 用 数学 语言 来 描述 ， 
就 是 进行 卷 积 运算 。 

设 f(x, y) 和 h(x, y) 为 MxNN 的 两 个 离散 函数 ， 两 者 的 卷 积 用 f(x，y) * h(x,，y) 表 
示 ， 其 表达 式 为 



































fg) hx) = HN 2 Sf mm) hls -my ~n) (3. 39) 
若 F(u, 2v) 和 HH(u, vv) 分 别 表 示 f(x,，y) 和 h(x,，y) 的 侍 里 叶 变 换 ， 由 卷 积 定理 可 知 ， 
空间 域 上 的 卷 积 对 应 其 在 频 域 上 的 点 积 ， 频 域 上 的 卷 积 对 应 其 在 空间 域 上 的 点 积 ， 即 
f(x,y) *¥ h(x,y) OF (u,v)H(u,v) (3. 40) 
fx,yh(x,y) OF (u,v) * H(u,v) (3.41) 
式 (3.40) 和 式 (3. 41 ) 就 构成 了 卷 积 定理 。 
根据 卷 积 定理 ， 在 具体 的 滤波 操作 中 ， 首 先 要 将 原 图 像 凡 xz，7y) 和 滤波 器 h(x，y) 分 别 
进行 傅 里 叶 变 换 得 到 (wu, v) 和 (ww,，v)， 然 后 在 频 域 中 进行 了 (wu, v) 和 (wu, wv) 的 对 应 点 
积 运算 ， 即 (wu, wv) 的 第 一 个 元 素 乘 以 F(u, vv) 的 第 一 个 元 素 ，H(wu, v) 的 第 二 个 元 素 乘 以 
(u,v) 的 第 二 个 元 素 ， 依 此 类 推 。 最 后 将 频 域 中 滤波 后 的 运算 结果 进行 储 里 叶 反 变换 ， 即 
可 得 到 滤波 后 的 图 像 z(x,y)， 即 
g(x,y) = FLIH(u,v) PF (u,v)] (3. 42 ) 
这 里 (u,v) 被 称 为 传递 函数 或 转移 函数 ， 它 是 频 域 滤波 的 关键 。 其 设计 的 基本 思路 
是 ,保留 某 些 频 率 分 量 ， 限 制 或 消除 男 一 些 频 率 分 量 。 为 了 观察 方便 ,通常 在 进行 健 里 叶 变 
换 前 ， 将 图 像 进行 中 心 变换 。 此 时 频 域 滤波 的 主要 步骤 可 以 如 下 描述 : 
1) 将 原 图 像 fx，y) 乘 以 ( -1)， 得 到 图 像 六 (x*，y) ， 也 就 是 
f(x, 7)=f(x, 7)( 1) 
2) 将 (x，y) 代 入 式 (3.27)， 并 进行 传 里 叶 变 换 得 到 PC， 。 
3) 在 频 域 中 ， 计 算 滤波 器 函数 (u,v) 和 (u,v) 的 点 积 G(u, v)。 
4) 在 频 域 中 根据 具体 的 应 用 对 G(w， wv) 进行 处 理 得 到 G'(w, wv)。 
5) 将 GC'(u, v) 代 入 式 (3.28)， 并 进行 傅 里 叶 反 变换 得 到 其 空间 域 函 数 g' (x，y)。 
6) 用 ( -1)""? 乘 以 g'(x,y) 得 到 频 域 滤波 后 的 图 像 g(x，y)。 
需要 指出 的 是 : 当 输入 图 像 和 滤波 需 函 数 为 实 函 数 时 ， 反 传 里 叶 变 换 的 虚 部 应 该 为 零 。 
实际 上 ， 由 于 计算 的 舍 入 误差 ， 反 健 里 叶 变 换 一 般 有 寄生 的 虚 部 成 分 ， 这 些 成 分 可 以 忽略 不 
计 。 
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【 例 3.6】 二 维 离散 传 里 叶 变 换 实例 
图 3. 10a 所 示 为 在 尺寸 为 512 x 152 像 的 黑色 背景 上 姜 加 一 个 尺寸 为 20 x40 的 白色 和 拢 
形 。 如 图 3. 10b 所 示 ， 此 图 像 在 进行 傅 里 叶 变换 的 计算 之 前 被 乘 以 ( -1)*”， 从 而 可 以 使 频 
域 关 于 中 心 对 称 。 注 意 两 张 图 的 位 置 、 标 志和 轴 的 原点 的 对 应 关系 。 
从 图 3. 10b 可 以 看 出 , 立方 向 谱 的 零点 分 割 恰好 是 * 方向 零点 分 隔 的 两 倍 。 这 却 相 反 地 
合 图 像 中 1:2 的 和 矩形 尺寸 比例 。 

















We 


| Ty | 
Wi | 








x 
a) 尺寸 为 512X512 像 素 的 黑色 背景 上 | 
征 加 一 个 尺寸 为 20X40 的 白色 秆 形 图 像 


u 
b) 传 里 叶 频谱 





图 3.10 傅 里 叶 频 谱 计算 的 示例 
3. 3.5 ” 频 域 滤波 和 空间 域 滤波 的 关系 


频 域 滤波 比较 直观 ， 可 以 凭 直观 选择 滤波 器 ， 但 需要 进行 傅 里 叶 变 换 和 反 变 换 。 即 将 尺 
度 为 MxNN 的 函数 变换 为 尺度 同样 为 M x 的 傅 里 叶 变换 ， 然 后 指定 频 域 的 滤波 器 ， 对 应 相 
乘 完 成 频 域 滤波 ,最 后 健 里 叶 反 变换 得 到 滤波 后 的 图 像 。 

如 果 在 频 域 指定 滤波 带 ， 将 滤波 融 反 变换 回 空间 域 ， 则 空间 域 滤 波 右 尺度 为 MxN， 将 

空间 域 MY xN 信号 与 滤波 器 卷 积 完成 滤波 。 这 样 做 的 缺点 是 计算 量 很 大 。 

根据 以 上 描述 的 空间 域 滤波 可 知 ， 空 间 域 滤波 从 计算 量 和 效果 角度 看 都 是 可 取 的 。 那 么 
2 zs 间 域 滤波 的 模板 呢 ? 

空间 域 滤波 和 频 域 滤波 是 统一 的 。 即 在 频 域 设 计 滤波 右 ， 然 后 反 变换 成 同样 尺度 
然后 对 MxN 尺度 的 滤波 占 采 用 截断 等 方法 近似 处 理 。 形 成 小 尺度 的 空间 
0 就 是 线性 空间 域 滤波 中 的 卷 积 模板 。 这 样 就 可 以 进行 空间 域 滤波 了 。 

线性 空间 域 滤波 的 卷 积 模板 都 是 通过 频 域 设计 的 。 频 域 可 以 看 成 为 一 个 “实验 室 ”， 可 
以 利用 频率 成 分 和 图 像 外 表 之 间 的 对 应 关系 。 一 些 在 空间 域 表 述 非常 困难 ， 其 至 是 不 可 能 
述 的 图 像 成 分 ， 在 频 域 中 变 得 突出 而 直观 。 可 以 通过 频 域 实验 选择 滤波 器 ， 进 而 设计 二 维 空 
间 数 字 滤 波 器 ， 在 空间 域 实 施 滤波 操作 。 


3. 3.6 频 域 低 通 滤波 


常用 的 频 域 滤波 方法 有 低 通 滤 波 、 高 通 滤波 、 带 通 和 带 阻 滤波 、 同 态 滤波 等 方法 。 在 传 
里 叶 变 换 中 ， 低 频 成 分 对 应 了 图 像 中 灰 度 值 变 化 比较 缓慢 的 区 域 ， 而 高 频 成 分 则 表征 了 图 像 
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中 物体 的 边缘 与 随机 噪声 等 信息 。 因 此 ， 在 一 幅 给 定 的 图 像 中 ， 通 过 频 域 对 一 定 范围 内 的 高 
频 分 量 进 行 衰减 就 能 够 达到 去 除 噪声 、 平 滑 图 像 的 目的 。 这 种 抑制 图 像 中 的 高 频 分 量 、 保 留 
低频 分 量 的 图 像 平 滑 方 法 就 是 频 域 低 通 滤 波 方法 。 在 频 域 低 通 滤波 需 设 计 中 ， 常 用 的 传递 函 
数 玉 zw， 2 有 如 下 几 种 。 

1. 理想 低 通 滤波 器 (Ideal Low Pass Filter，ILPF) 

最 简单 的 低 通 滤波 右 是 “截断 ” 健 里 叶 变 换 中 的 高 频 成 分 ， 其 传递 函数 有 (wu, vw) 的 表达 
式 为 























1 D(u,v) < DD, 
H(u,v) = (3.43) 
0 D(u,v) > Di 
式 中 ，D, 为 指定 的 非 负 数值 (也 称 为 截止 频率 ); D(w, vv) 为 点 (u,v) 到 频率 平面 原点 的 距 
离 ， 即 
D(u,v) = Vw +v (3.44) 
如 果 图 像 的 尺度 为 MxN， 健 里 叶 变 换 具 有 相同 的 尺寸 ， 如 果 图 像 信 号 在 进行 傅 里 叶 变 
换 过 程 中 已 经 被 中 心 化 了 ， 侍 里 叶 变 换 的 中 心 ( 频 率 和 矩形 的 中 心 ) 已 经 被 移 位 到 (ww，wv) = 
(M/2,，N/2) 处 。 此 时 ， 从 点 (u,v) 到 侍 里 叶 变 换 中 心 的 距离 为 
MY NY 让 
Do = [(u -3) + -站 (3.45) 
图 3. 10a 所 示 为 理想 低 通 滤波 带 的 特性 曲线 ( 径 向 模 截 面 )， 在 半径 为 D, 的 圆 内 ， 所 有 
频率 分 量 都 无 损 地 通过 滤波 器 ;而 在 此 半径 的 圆 外 ， 所 有 频率 被 完全 截止 掉 。 
需要 说 明 的 是 ， 完 整 的 理想 低 通 滤波 器 变换 函数 应 是 图 3. 10a 所 示 曲 线 绕 着 原点 转 360。 
而 形成 的 圆柱 形 昌 面 。 理 想 低 通 滤波 器 无 法 用 硬件 实现 ， 但 却 很 容易 用 计算 机 模拟 。 
截止 频率 Dp, 的 确定 是 理想 低 通 滤波 器 设计 的 关键 。 常 用 的 截止 频率 确定 方法 是 采用 直 
接 观察 法 和 功率 法 。 功 率 法 通过 计算 保留 频谱 的 功率 百分比 来 确定 滤波 器 的 半径 ， 即 截止 频 
率 。 基 于 功率 法 确定 截止 频率 的 基本 步骤 可 以 描述 如 下 ; 
(1) 首先 计算 整个 图 像 所 有 频率 的 总 功率 P 
将 每 个 点 (u,v) 的 功率 谱 成 分 相 加 ， 即 可 得 到 总 的 图 像 功 率 ， 其 表达 式 为 


M-1 N-l 


P,= > 2, Pu,0) (3.46) 


u=0 

































































式 中 ，P(w, v) 为 图 像 的 功率 。 

(2) 根据 确定 的 功率 百分比 确定 截止 频率 。 

假设 傅 里 叶 变换 已 经 被 中 心 化 ， 根 据 式 (3. 47 ) 计算 不 同 半径 > 所 包含 的 图 像 功 率 占 总 功 
率 的 百分比 a。 当 a 不 小 于 指定 的 百分比 时 的 半径 ， 即 是 截止 频率 (u,v) ， 有 

P(u,v 
a = 100| 2 | (3.47) 

对 于 一 幅 图 像 ， 一 般 情况 下 ，a 应 该 不 低 于 95。 如 果 a 的 值 过 低 ， 低 通 滤波 器 得 到 的 图 
像 会 比较 模糊 ， 细 节 不 清 。 

2. 巴特 沃 思 (Butter Worth ) 低 通 滤波 器 

具有 截止 频率 为 D,( 距 原点 的 距离 ) 的 n 阶 巴特 沃 思 低 通 滤 波 器 传递 函数 的 表达 式 为 
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H(u,v) = (3. 48 ) 


1 
D(u,v) \” 

|) 

式 中 ,，D(w, v) 可 由 式 (3.44) 或 式 (3.45) 表 示 ; D, 为 截止 频率 ; nn 为 函数 的 阶 数 。 
巴特 沃 思 低 通 滤 波 器 传递 函数 的 特性 曲线 如 图 3. 11 所 示 。 不 同 于 理想 低 通 滤波 器 ， 巴 

特 沃 思 传递 函数 在 通过 频率 与 抑制 频率 之 间 并 没有 明显 截断 ， 因 此 其 滤波 效果 好 于 理想 低 通 














滤波 器 。 对 于 具有 平滑 传递 函数 的 滤波 器 ， 通 常 将 H(w，v) 下 降 到 最 大 值 的 某 一 分 数值 的 那 
个 点 ， 定 位 为 截止 频率 。 在 实际 应 用 中 ， 下 面 两 种 定义 的 截止 频率 用 得 较 广 。 


H(u,v) 














1 
Do D(u,v) 


a) 巴特 沃 思 低 通 滤波 器 b) 以 图 像 显 示 的 滤波 器 9) 阶 数 1 一 4 的 滤波 器 径 向 横 鹤 面 
传递 函数 透视 图 





图 3.11 巴特 沃 思 低 通 滤 波 器 传递 函数 特性 曲线 
1) 截止 频率 的 H(w, v) 为 最 大 值 的 1/2。 在 式 (3.48) 中 , 当 D(u, v) =D。 且 n=1 时 ， 
H(u, v) =0.5。 
2) 截止 频率 的 及 (w， vw) 为 最 大 值 的 1/Y2。 此 时 ， 式 (3. 48 ) 经 过 修正 后 可 以 表示 为 
i 二 | (3.49) 
1 +[( -1)D(u,v)/D, 
3. 指数 低 通 滤波 器 (Exponent Low Pass Filter，ELPF) 
指数 低 通 滤波 器 是 图 像 处 理 中 常用 的 一 种 滤波 器 。 具 有 截止 频率 的 指数 低 通 滤波 器 ， 
其 传递 防 数 为 

















H(u,v) = et" 00)" (3. 50) 
式 中 ,，D(wu, v) 由 式 (3.44) 或 式 (3.45) 决 定 ; n 为 决定 指数 函数 的 衰减 率 。 指 数 低 通 滤波 器 
的 特性 曲线 如 图 3. 12c 表示 。 指 数 低 通 滤波 器 的 截止 频率 设计 方法 与 巴特 沃 思 低 通 滤波 器 基 
本 相同 。 
1) 截止 频率 的 H(w, vw) 为 最 大 值 的 1/2。 在 式 (3.50) 中 ,， 当 D(u, v)=D, 且 n=1 时 ， 
Hlws Y=0,.5, 
2) 截止 频率 的 有 (u,v) 为 最 大 值 的 1/Y2。 此 时 ， 其 传递 函数 经 过 修正 后 可 以 表示 为 
H(u,v) = eLn(IA2) ILD ,0) /Do]" (3.51) 
与 巴特 沃 思 低 通 滤 波 器 一 样 ， 指 数 低 通 滤波 器 的 传递 函数 也 是 平滑 过 渡 的 ， 不 存在 不 连 
续 的 现象 。 但 是 ， 指 数 低 通 滤波 器 的 传递 函数 在 开始 阶段 衰减 得 比较 快 ， 对 高 频 分 量 的 滤 除 
作用 比较 强 ， 因 此 对 图 像 造成 的 模糊 较 大 。 
4. 梯形 低 通 滤波 器 (Trapezia Low Pass Filter，TLPF) 
梯形 低 通 滤波 器 是 理想 低 通 滤波 器 的 一 种 有 效 改 进 ， 其 传递 函数 为 
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1 D(u,v) < D, 
二 D0) -D1] oe (3. 52) 
0 . 
0 D(u,v) > DD 


式 中 ,，D(w, v) 由 式 (3.44) 或 式 (3.45) 决 定 ; D, 为 截止 频率 。 图 3. 12d 给 出 了 典型 的 梯形 
低 通 滤波 器 传递 函数 的 特性 曲线 。 


| 
| 
Do Do Di 
a) 理想 低 通 滤波 器 b) 巴特 沃 思 低 通 滤 波 器 0) 指数 低 通 滤波 器 d) 梯形 低 通 滤波 器 
图 3.12 低 通 滤波 融 的 特性 曲线 

从 图 3.12 可 以 看 出 ,在 D,(D, > Do) 的 尾部 包含 一 部 分 高 频 分 量 ， 因 此 采用 梯形 低 通 滤 
波 句 的 图 像 清晰 度 比 采用 理想 低 通 滤波 器 的 图 像 清晰 度 有 所 改善 。 应 用 时 ， 合 理 地 调整 刀 
的 值 ， 既 能 达到 平滑 图 像 的 目的 ， 又 可 以 使 图 像 保 持 足够 的 清晰 度 。 

上 述 几 种 低 通 滤波 器 中 ， 理 想 低 通 滤波 器 的 噪声 平滑 效果 最 好 ， 但 是 相应 的 岁 像 边缘 、 
细节 也 变 模糊 了 。 理 想 低 通 滤波 器 的 性 能 在 工程 上 无 法 用 硬件 实现 ， 而 且 存在 严重 的 振 铃 效 
应 ， 所 以 工程 上 多 使 用 其 他 三 种 低 通 滤波 器 。 不 管 采 用 何 种 滤波 器 ， 合 理 选取 D。 是 应 用 低 
通 滤波 器 的 关键 。 


3.4 图 像 增 强 


1 



































图 像 增强 是 指 按 实际 需要 采取 相应 的 技术 手段 强调 图 像 中 的 某 些 特征 而 抑制 其 他 信息 ， 
以 改善 视觉 效果 ， 或 使 之 更 适合 于 图 像 的 后 续 处 理 及 特定 应 用 的 过 程 。 作 为 基本 的 图 像 处 理 
技术 ， 图 像 增强 包含 的 内 容 比 较 广泛 。 对 比 度 增强 ， 边 缘 、 轮 廊 、 纹 理 增强 ,图像 锐 化 ， 品 
声 去 除 和 几何 畸变 校正 等 在 广义 上 都 可 称 为 图 像 增强 。 其 中 ， 图 像 对 比 度 与 灰 度 梯 度 相关 ， 
对 比 度 的 高 低 预示 着 灰 度 梯度 的 大 小 , 边缘、 轮廓 和 纹理 增强 也 意味 着 对 比 度 增强 。 

对 比 度 是 指 图 像 中 明亮 部 分 与 阴暗 部 分 的 灰 度 之 比 。 在 对 比 度 高 的 图 像 中 ， 物 体 的 轮廓 
清晰 、 灰 度 层 次 分 明 。 相 反 ， 在 对 比 度 低 的 图 像 中 ， 物 体 的 轮廓 模糊 ， 细 节 分 辨 不 清 。 在 物 
体 成 像 过 程 中 ， 如 果 曝 光 不 足 或 者 曝光 过 度 ， 都 会 使 图 像 的 灰 度 范围 局 限 在 一 个 很 小 的 范围 
内 。 这 时 的 图 像 细节 模糊 不 清 、 灰 度 层 次 不 明显 ， 对 比 度 不 强 。 改 善 图 像 灰 度 层次 、 提 高 对 
比 度 的 图 像 处 理 方法 就 是 对 比 度 增强 。 

对 比 度 增 强 方法 主要 有 三 类 : 空间 域 增强 方法 、 变 换 域 增强 方法 和 基于 参数 优化 的 增强 
方法 等 。 空 间 域 增强 方法 是 直接 在 图 像 所 在 的 空间 进行 处 理 ， 包 括 基于 像素 的 处 理 和 基于 模 
板 的 处 理 。 变 换 域 增强 方法 是 将 图 像 变 换 到 频 域 或 小 流域 ,对 图 像 的 变换 系数 进行 某 种 修 
正 ， 然 后 通过 反 变换 获得 增强 图 像 ， 如 频 域 增强 和 小 波 域 增强 等 。 


3.4.1 空间 域 增 强 
1. 灰 度 变换 基本 原理 
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空间 域 增强 是 在 图 像 空 间 直 接 对 图 像 的 灰 度 值 进行 处 理 ， 并 使 处 理 后 的 图 像 清晰 度 增 
加 ， 因 此 也 称 为 灰 度 变换 方法 。 灰 度 变换 主要 包括 直接 灰 度 变换 和 直方 图 变换 两 大 类 方 
法 。 

灰 度 变换 的 基本 原理 可 以 描述 为 ,， 设 r 和 ;分 别 代表 原始 图 像 f(x，y) 和 增强 图 像 g(x， 
y) 的 灰 度 ，7( ) 为 映射 函数 ， 通 过 映射 函数 7( ) 将 Ax，y) 中 的 灰 度 + 映 冉 成 z(x,y) 中 的 灰 
度 s， 使 得 图 像 灰 度 的 动态 范围 得 以 扩展 或 压缩 ， 从 而 改善 图 像 的 对 比 度 。 空 间 域 增强 的 关 
键 在 于 设计 一 个 合适 的 映射 函数 。 目 前 ， 映 射 函 数 的 设计 主要 有 如 下 两 类 方法 : 

1) 根据 图 像 特点 和 处 理工 作 需 求 ， 人 为 设计 映射 函数 ,试探 其 处 理 效果 。 

2) 从 改变 图 像 整 体 的 灰 度 分 布 出 发 ,设计 一 种 映射 泡 数 ， 使 变换 后 图 像 灰 度 直方 图 达 
到 或 接近 预定 的 形状 。 映 射 变换 的 类 型 取决 于 所 需 增 强 特性 的 选择 。 

2. 直接 灰 度 变换 

直接 灰 度 变换 是 图 像 对 比 度 增强 的 一 种 有 效 手 段 。 其 特点 是 变换 过 程 与 图 像 的 像素 位 置 
及 被 处 理 像 素 的 邻 域 灰 度 无 关 ， 是 一 种 典型 的 基于 像素 的 空间 域 处 理 方法 。 直 接 灰 度 变换 主 
要 有 三 种 方法 : 线性 灰 度 变换 、 分 段 线性 灰 度 变换 和 非 线性 灰 度 变换 。 

(1) 线性 灰 度 变换 

顾名思义 ,线性 灰 度 变换 的 映射 函数 为 线性 函数 ( 见 图 3. 13 ) ， 其 表达 式 为 
2 (fo) -a)+b, (3. 53) 
式 中 , a 与 a, 可 从 直方 图 上 获得 。 显 然 , 车 1 5 -5,1 > 1 ou -ol ， 则 图 像 的 对 比 度 被 扩 
展 。 对 离散 图 像 而 言 ， 变 换 前 后 的 图 像 像素 总 数 尽 管 不 变 ， 但 不 同 像素 之 间 的 灰 度 差 加 大 ， 
因此 对 比 度 加 大 ， 图 像 质 量 得 以 提高 。 线 性 灰 度 变换 的 特点 是 ， 对 整个 图 像 的 灰 度 一 视 同 
仁 ， 均 按 同一 个 规律 进行 拉 伸 处 理 。 

(2) 分 段 线性 灰 度 变换 
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图 3.13 线性 灰 度 变换 的 妈 3.14 三 段 线性 灰 度 变换 
映射 函数 示意 图 的 映射 函数 示意 图 


分 段 线 性 灰 度 变 换 将 整个 图 像 灰 度 空 间 分 成 两 段 其 至 多 段 ， 每 段 分 别 作 线 性 变换 ， 且 和 斜 
率 不 同 。 分 段 线性 变换 的 优点 是 可 以 根据 用 户 的 需要 ， 拉 伸 感 兴趣 的 图 像 灰 度 细节 ， 相 对 地 
抑制 不 感 兴趣 的 灰 度 级 。 图 3. 14 所 示 为 一 个 分 三 段 作 线性 灰 度 变换 的 函数 ， 其 数学 表达 式 
为 
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ee fg) a) th fy) < 
g(xX,y) = 2 Ul, y) -a@) +b, a, f(x,y) < as (3.54) 
hh -03) +b a f(x,y) < a 
式 中 ，ow ，a,，Q3，a4 和 0b ，b,，53，bs 分 别 是 线段 1 ，1,，4 的 端点 坐标 。 


如 果 1 -bl >la-al、 | bb <lo-wl 和 | by-6|l <lao-al ， 则 
扩展 第 一 区 间 [ a, ，a, | 的 灰 度 值 ， 压 缩 第 二 区 间 [ a,，a; | 与 第 三 区 间 [ cs ，o ] 的 灰 度 值 ， 
此 得 到 低 灰 度 级 被 增强 的 图 像 。 

如 果 1 久 -总 <lia-owl ,16-bl >la-wl, 116-61 <la-al ， 则 
扩展 第 二 区 间 [a,，a;] 的 灰 度 值 ， 压 缩 第 一 区 间 [a, ，o? ] 与 第 三 区 间 [ as ，os ] 的 灰 度 值 ， 
此 得 到 中 灰 度 级 被 增强 的 图 像 。 

如 果 | bb >loa-al, 且 1 6-b|l <la-owl、16-b,|l <la-a,l, 
则 图 像 的 高 灰 度 级 被 增强 。 

图 3. 15 所 示 为 四 种 典型 的 分 段 线性 灰 度 变换 函数 。 其 中 ， 两 端 裁 前 的 分 段 线 性 灰 度 变 
换 用 于 扩展 中 间 灰 度 区 ， 而 将 低 灰 度 区 和 高 灰 度 区 强行 压缩 为 固定 的 值 ; 锯齿 形变 换 用 于 显 
现 图 像 的 轮廓 线 ， 它 能 把 不 同 灰 度 范围 变换 成 相同 的 灰 度 范围 输出 ; 反 转 变换 主要 用 于 图 像 
的 反 转 ， 并 裁剪 高 亮 区 部 分 ; 裁剪 变换 则 用 于 图 像 的 二 值 化 。 





























a) 两 端 裁剪 的 - b) 锯齿 形 的 c) 反 转 的 d) 裁剪 的 
图 3.15 四 种 典型 的 分 段 线性 灰 度 变换 函数 

(3) 非 线 性 灰 度 变换 

非 线 性 灰 度 变换 所 采用 的 变换 函数 为 非 线 性 函数 ， 常 用 的 非 线性 灰 度 变换 为 指数 灰 度 变 
换 、 对 数 灰 度 变 换 及 指数 和 对 数组 合 的 灰 度 变换 。 

指数 灰 度 变换 是 指 输出 图 像 g(x，7y) 与 输入 图 像 Kx ，y) 的 灰 度 变换 关系 为 指数 形式 ， 
即 

g(x,y) = aexp[f(%,y)] 或 g(x,y) = b™ (3. 55 ) 

指数 灰 度 变换 用 于 压缩 输入 图 像 中 低 灰 度 区 的 对 比 度 ， 而 扩展 高 灰 度 区 的 对 比 度 ， 其 曲 
线形 状 如 图 3. 16a 所 示 。 为 了 增加 灰 度 变换 的 动态 范围 ， 修 改 曲线 的 起 始 位 置 或 变化 速率 
等 ， 可 加 入 一 些 调节 参数 ， 例 如 








g(x,y) 三 DA%,y) ~o] -1 (3. 56) 
式 中 ，a、5、c 均 为 可 调 参 数 。 参 数 a 可 以 控制 曲线 的 起 始 位 置 ， 参数 c 可 以 改变 曲线 的 变 
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对 数 灰 度 变换 就 是 输出 图 像 g(x，y) 与 输入 图 像 Kx，7y) 的 灰 度 关系 为 对 数 形式 ， 其 表 
达 式 为 
8(%,y) = alg[f(x,y) +1] (3.57) 
对 数 的 底 可 以 根据 需要 灵活 选择 。 在 实际 应 用 中 ， 一 般 取 自然 对 数 灰 度 变换 。 对 数 灰 度 
变换 用 于 压缩 输入 图 像 中 高 灰 度 区 的 对 比 度 ， 而 扩展 低 灰 度 区 的 对 比 度 ， 曲 线形 状 如 图 
3. 16b 所 示 。 为 了 增加 灰 度 变换 的 动态 范围 和 灵活 性 ， 修 改 曲 线 的 起 始 位 置 或 变化 速率 等 ， 
对 数 灰 度 变换 也 可 以 加 入 一 些 调节 参数 ， 例 如 
g(%,y) = b+alglf(x,y) +1 -ce] (3. 58) 
式 中 , a、 上 5b、 c 均 为 可 调 参 数 。 
指数 与 对 数组 合 的 灰 度 变换 就 是 输入 图 像 的 某 个 区 间 采 用 对 数 灰 度 变换 ， 而 其 他 区 间 采 
用 指数 灰 度 变换 的 灰 度 变换 方式 。 如 果 输 出 图 像 z(x,y) 的 0 一 m 灰 度 区 与 输入 图 像 f(x， 
yY) 的 0-—n 灰 度 区 之 间 的 灰 度 关系 为 指数 形式 ， 而 其 余 区 域 之 间 的 灰 度 关系 为 对 数 形 式 ， 其 
表达 式 可 以 表示 为 
bfAsn -eo 1 0 < f(x, y) 反 <n 


a 1 +alog[f(x,y) +1-c]j n <f(x,y) < 255 
该 灰 度 变换 用 于 压缩 输入 图 像 中 高 、 低 灰 度 区 两 端的 对 比 度 ， 而 扩展 中 间 灰 度 区 的 对 比 
度 。 曲 线形 状 如 图 3. 16c 所 示 的 实 线 。 
如 果 输 出 图 像 z(x,y) 的 0 一 m 灰 度 区 与 输入 图 像 x,y) 的 0-—n 灰 度 区 之 间 的 灰 度 关 
系 为 对 数 形式 ， 而 其 余 区 域 之 间 的 灰 度 关系 为 指数 形式 ， 则 其 表达 式 可 以 表示 为 
b+alog[f(x,y) +1-c] 0</(x,y) <n 
en = | be 1 n < f(x,y) < 255 0 
此 时 ， 对 数 与 指数 的 组 合 灰 度 变换 曲线 如 图 3. 16c 中 的 虚线 所 示 。 它 用 于 压缩 中 间 段 灰 
度 区 的 对 比 度 ， 而 扩展 高 、 低 灰 度 的 对 比 度 。 


ZL # 


a) 指数 灰 度 变换 b) 对 数 灰 度 变换 。 “0) 指数 与 对 数组 合 的 灰 度 变换 
图 3.16 非 线 性 灰 度 变换 的 变换 函数 曲线 























(3.59) 


























3.4.2 直方 图 均衡 化 


1. 直方 图 

直方 图 是 数字 图 像 处 理 中 的 一 个 重要 概念 。 所 谓 直 方 图 是 关于 图 像 中 灰 度 分 布 的 函数 ， 
即将 数字 图 像 中 的 所 有 像素 ， 按照 灰 度 值 的 大 小 ， 统计 每 个 灰 度 值 的 概率 。 对 于 数字 图 像 所 
出 现 的 概率 值 ， 其 表达 式 为 


| (3. 61)) 
n 
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式 中 , 六 为 图 像 六 zx，y) 的 第 大 级 灰 度 值 ; ni 为 fx,，y) 中 具有 灰 度 值 7 的 像素 的 个 数 ; 7 
为 图 像 像素 总 数 ; L 为 灰 度 等 级 数 ， 最 常用 的 灰 度 等 级 数 是 256。 
可 见 直 方 图 提供 了 一 幅 图 像 所 有 灰 度 值 的 整体 分 布 描述 。 通 常 直方 图 用 二 维 图 形 表示 ， 











横 坐 标 表示 图 像 的 灰 度 级 ， 纵 坐标 代表 每 个 灰 度 级 的 像素 数 占 全 图 部 像素 数 的 百分比 。 这 


样 ， 通 过 灰 度 直 方 图 就 可 以 对 图 像 的 某 些 整体 特性 进行 描述 。 
图 3. 17 所 示 为 四 个 基本 图 像 ( 亮 、 暗 、 低 对 比 度 与 高 对 比 度 ) 及 其 对 应 的 灰 度 直方 图 。 


于 








区 


xX 


方 
直 
方 


图 中 可 以 看 出 ， 暗 图 像 由 于 拥有 较 多 的 低 灰 度 值 像素 ， 因 此 它 的 直方 图 主要 分 布 在 低 灰 度 


， 而 高 灰 度 区 的 灰 度 分 布 函数 值 较 小 或 为 0; 亮 图 像 则 拥有 和 较 多 灰 度 值 较 高 的 像素 ， 其 直 








图 分 布 主要 集中 在 高 灰 度 区 ， 低 灰 度 区 的 灰 度 分 布 函 数值 较 小 或 为 0; 低 对 比 度 的 图 像 的 
方 图 则 主要 集中 在 某 个 灰 度 区 域内 ， 其 他 区 域内 的 像素 数 则 较 少 ， 而 高 对 比 度 的 图 像 的 直 
图 分 布 比 较 均 匀 ， 基 本 和 鹤 盖 了 所 有 的 像素 灰 度 级 。 





图 3.17 


四 个 基本 





























图 像 ( 亮 、 暗 、 低 对 上 








及 其 对 应 的 灰 度 直方 


总 之 , 图像 的 直方 图 包含 了 非常 丰富 的 信息 ， 是 











Et 度 、 高 对 比 度 图 像 ) 
图 
图 像 人 处 理 中 的 一 种 十 分 重要 的 分 析 工 
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具 。 它 具有 如 下 三 条 性 质 : 

1) 直方 图 是 一 幅 图 像 中 各 像素 灰 度 出 现 频次 的 统计 结果 ， 它 只 反映 图 像 中 不 同 灰 度 值 
出 现 的 次 数 ， 而 不 反映 茶 一 灰 度 所 在 的 位 置 。 也 就 是 说 ， 它 只 包含 了 该 图 像 的 某 一 灰 度 像素 
出 现 的 概率 ， 而 忽略 其 所 在 的 位 置信 息 。 

2) 任意 一 幅 图 像 ， 都 有 惟一 确定 的 一 幅 直 方 图 与 之 对 应 。 但 不 同 的 图 像 可 能 有 相同 的 
直方 图 ， 即 图 像 与 直方 图 之 间 是 多 对 一 的 映射 关系 。 

3) 由 于 直方 图 是 对 具有 相同 灰 度 值 的 像素 进行 统计 而 得 到 的 ， 因 此 一 幅 图 像 中 各 部 分 
区 域 的 直方 图 之 和 等 于 整个 图 像 的 直方 图 。 

直方 图 变换 的 关键 也 是 寻找 一 个 恰当 的 变换 函数 7(r) ， 通 过 调整 图 像 的 直方 图 而 达到 
调整 图 像 对 比 度 的 目的 。 常 用 的 直方 图 变换 方法 有 直方 图 均衡 化 方法 与 直方 图 规定 化 方法 。 

2. 直方 图 均衡 化 方法 

直方 图 均衡 化 方法 的 基本 思想 是 把 原始 的 直方 图 变换 成 均匀 分 布 的 形式 。 增 加 了 像素 灰 
度 值 的 动态 范围 ， 达 到 增强 图 像 整 体 对 比 度 的 效果 。 

(1) 灰 度 级 及 变换 函数 

假设 变量 + 表示 待 增强 图 像 的 灰 度 级 , r+ 在 [0, 上 -1]。 为 讨论 问题 方便 ,将 7 归 一 化 到 
区 间 [0, 1] ， 且 r=0 表示 黑色 及 r=1 表示 白色 。 考 虑 一 个 连续 函数 7(r) ， 对 任意 一 个 满 
足 上 述 条 件 的 >， 进行 如 下 变换 : 












































s=7(r),0<r<1 (3.62) 
即 对 于 每 一 个 像素 值 + 产生 一 个 相应 的 灰 度 值 ;。 上 述 变 换 函 数 7(r) 需 满足 如 下 条 件 : A， 
T(r7) 在 0<r<1 中 为 单 值 且 单 调 递 增 , B， 当 0<r<1 时 , 0<7(r) <1。 条 件 A 要 求 7(7) 为 
单 值 是 为 了 保证 反 变 换 存 在 ,单调 条 件 则 保持 输出 图 像 从 黑 到 白 顺 序 增加 。 变 换 函 数 不 单 调 
增加 将 导致 至 少 有 一 部 分 亮度 范围 被 颠倒 ， 从 而 在 输出 图 像 中 产生 一 些 反 转 灰 度 级 。 条 件 B 
保证 输出 灰 度 级 与 输入 有 同样 的 范围 。 由 s 到 7 的 反 变换 可 以 表示 为 

r=7"(s),0<s=<1 (3. 63 ) 








(2) 概率 密度 函数 的 关系 

图 像 灰 度 级 可 以 看 作 [0,1] 区 间 的 随机 变量 。 随 机 变量 可 以 采用 概率 密度 也 数 ( Proba- 
bility Density Function ，PDF ) 描述 。 令 P,(r) 和 P.(s) 分 别 代 表 随 机 变量 + 和 ;s 的 概率 密度 也 
数 。 

由 概率 理论 可 知 ， 如 果 P,(7r) 和 7T(7) 已 知 ， 且 771(;s) 满 足 条 件 B， 那 么 由 7(7) 变换 后 
的 随机 变量 * 的 概率 密度 函数 P,(s ) 为 


P.(s) = P,(7) 





dr 
ek 3. 64 
下 (3. 64 ) 








即 随机 变量 ; 的 概率 密度 函数 由 输入 图 像 的 灰 度 级 PDF 和 所 选择 的 变换 函数 决定 。 
(3) 累积 分 布 困 数 
选择 累积 分 布 函 数 作 为 变换 孔 数 ， 即 
s = 了 (7r) = | P,(w) dw (3. 65 ) 
式 中 ，w 为 积分 变量 。 式 (3. 65 ) 为 随机 变量 > 的 累积 分 布 函数 ( Cumulative Distribution Func- 
tion，CDF) 。 累 积分 布 函数 的 具有 如 下 特点 : 中 概率 密度 函数 永远 为 正 ， 函 数 积分 是 一 个 函 
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数 曲 线 下 的 面积 ， 所 以 累积 分 布防 数 是 单 值 单 调 增加 ,满足 变换 函数 条 件 A; @ 区 间 [0， 
1] 上 变量 的 概率 密度 函数 的 积分 也 在 区 间 [0，1] 上 ， 因 此 满足 变换 函数 条 件 B。 

因此 ， 累 积分 布 函 数 满足 变换 函数 的 条 件 ， 可 以 作为 图 像 灰 度 变换 的 变换 函数 。 

(4) P,(s) 分 布 

原 图 像 灰 度 级 变量 "通过 变换 函数 ?(r) ， 得 到 变换 后 的 灰 度 级 变量 *， 其 概率 密度 函数 
为 P.(s)。 由 微 积分 原理 ， 关 于 上 限 的 定 积 分 的 导数 就 是 该 上 限 的 积分 值 ， 即 











= 0 = [fp,(w)aw]= 已 Cn (3.66) 
将 此 结果 代入 式 (3. 64) ， 取 概率 值 为 正 ， 得 到 
dr | _ 1 
Pe | ey 二 | =1 0<s<1 (3. 67) 











(5) 结论 

因为 P.(s) 是 概率 密度 函数 ， 所 有 s 值 上 的 积分 等 于 1。 区 间 [0, 1] 以 外 其 值 为 0， 式 
(3.67) 中 给 出 的 P,(s) 形 式 为 均匀 概率 密度 函数 。 

可 见 ， 按 照 式 (3. 65 ) 给 出 的 变换 函数 得 到 一 个 随机 变量 ;， 其 概率 密度 函数 为 均匀 分 
布 , 与 P,(7) 的 形式 无 关 。 均 匀 分 布 表 明 ， 图 像 的 直方 图 是 均匀 的 ， 图像 对 比 度 得 到 了 增 
强 。 

(6) 离散 图 像 操 作 

对 于 离散 值 ， 处 理 其 概率 与 和 ， 而 不 是 概率 密度 函数 与 积分 。 一 幅 图 像 中 灰 度 级 六 出 
现 的 概率 近似 为 

P(r) = 于 k=0,1,,L-1 (3. 68) 

式 中 ,nn 为 图 像 中 像素 的 总 和 ; nj 为 灰 度 级 为 六 的 像素 的 个 数 ; 工 为 图 像 中 可 能 的 灰 度 级 总 
数 。 式 (3. 65 ) 中 变换 函数 的 离散 形式 为 

s, = T(r,) = YP.) = k=0,1,,L-1 (3..69) 

通过 式 (3. 69) ， 将 输入 图 像 中 灰 度 级 为 六 的 各 像素 映射 到 输出 图 像 中 灰 度 级 为 % 的 对 应 像 

素 


[oe] 





(7) 直方 图 均衡 化 计算 步骤 
综 上 所 述 ， 直 方 图 均衡 化 图 像 增 强 方法 的 实现 步 又 如 下 : 
1) 列 出 原始 图 像 灰 度 级 7;, k=0, 1, …, 上 -1; 

Py(fi) 1 Polg;) 











a 


fi Si 
图 3.18 直方 图 均衡 化 示意 图 
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2) 统计 原始 直方 图 各 灰 度 级 像素 mi 
3) 用 式 已 (rm) =m/n, k=0, 1,…, 上 -1, 0<r<1 计算 原始 直方 图 ; 


k 


4) 计算 累积 分 布 函 数 , s，= YP,(r) = > =0,1,.…,L-1; 


5) 由 于 上 面 计算 的 s; 取 值 范围 为 0 ~1， 而 数字 图 像 的 灰 度 范围 为 [0, L -1]， 因 此 需 
将 归 一 化 的 灰 度 值 恢复 到 数字 图 像 原 来 的 灰 度 范围 。 即 进行 取 整 操作 ，s = int[ (二 -1)se + 
0.5]( 四 含 五 人 ) ; 

6) 确定 映射 对 应 关系 (mr 一 sy ) ; 

7) 统计 新 直方 图 各 灰 度 级 像素 n,; 

8) 用 已 (s) =n,/n 计算 新 直方 图 。 

如 前 所 述 ， 式 (3. 69) ~ 式 (3.75) 给 出 的 变换 或 映射 称 为 直方 图 均衡 化 。 直 方 图 均衡 化 
可 以 展开 图 像 的 直方 图 ， 使 图 像 灰 度 级 能 跨越 更 大 的 范围 。 


< 












a) 原 图 b) 直方 图 均衡 化 的 结果 c) 相应 的 直方 图 
到 3. 19 直方 图 均衡 化 
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图 3. 19a 所 示 为 四 幅 图 像 ， 图 3. 19b 所 示 是 对 这 些 图 像 进 行 直 方 图 均衡 化 的 结果 。 前 三 
种 结果 显示 了 明显 的 改进 效果 。 第 四 幅 图 像 在 视觉 效果 上 没有 明显 改变 ， 这 是 因为 原 图 像 的 
直方 图 本 来 就 是 比较 均匀 的 。 对 于 不 同 的 原始 图 像 ， 直 方 图 均衡 化 后 的 视觉 效果 很 相似 ， 说 
明 直 方 图 均衡 化 是 适应 性 较 强 的 增强 工具 。 

【 例 3.7】 直方 图 均衡 化 计算 。 

以 图 3. 20a 给 出 的 大 小 为 4 x4、 灰 度 等 级 
为 8 的 图 像 来 分 析 直 方 图 均衡 化 方法 的 使 用 。 

(1) 列 出 图 像 的 各 个 灰 度 级 

0, 1, 2, 3, 4, 5, 6, 7 

(2) 统计 每 个 灰 度 级 的 像素 个 数 图 3.20 ”直方 图 均衡 实例 图 像 的 灰 度 
























































a) 原始 图 像 的 灰 度 分 布 b) 均衡 后 的 图 像 灰 度 分 布 








7 Ws, mn, 2 三 2 而 三 3 
(3) 计算 直方 图 中 的 各 项 
3 3 1 1 1 2 2 
P(0) =j6， P(1) =]16， P(2) =j16， P(3)=16; P(4) =j16， P(5) =16; P(6) =16; 





P(7) -元 
(4) 计算 直方 图 的 累积 分 布 函数 
RE 


13 10 
16， P,(7) ” 16 


(5) 计算 灰 度 均衡 后 的 离散 灰 度 值 
=int[ 言 x7)=1, =int | 识 x7]=3， 8 =int (x7)=3, =int (6*7]=4, 到 三 


il[( 阁 x7] =4， 35 -ia 基 x7j=5， 56 =int (所 x7)=6, 37 =int (中 x7]=7 

可 见 ， 经 过 直方 图 均衡 化 后 ， 仪 需要 1、3、4、5、6、7 共 6 个 灰 度 级 。 修 正 后 每 个 灰 
度 级 对 应 的 像素 数 和 概率 值 也 均 已 经 发 生 了 变化 。 其 中 ,修正 后 图 像 各 个 灰 度 级 的 像素 数 分 
别 为 3、4、2、2、2 和 3。 

均衡 化 后 的 直方 图 如 图 3. 21b 所 示 。 原 





4/16 























图 直方 图 的 灰 度 级 主要 集中 在 低 灰 度 级 和 高 ”3/16 3/16 

灰 度 级 。 在 均衡 化 后 的 图 像 中 ， 中 灰 度 级 也 

得 到 了 一 定 扩展 。 整 个 直方 图 显得 比较 均 

匀 ， 但 并 非 完全 均匀 ， 且 灰 度 间隔 被 拉 大 。 9) 原始 图 像 直方 图 b) 均衡 后 的 图 像 直方 图 
从 理论 上 讲 ， 直 方 图 灰 度 均衡 就 是 通过 图 3.21 直方 图 均衡 化 示例 

变换 函数 将 原 图 的 直方 图 调整 为 均匀 的 直方 图 。 而 实际 上 修正 后 的 直方 图 并 不 是 十 分 均衡 ， 








因为 原 图 像 中 某 些 像素 数 比 较 少 的 灰 度 级 可 能 会 和 与 之 相 邻 的 像素 数 较 多 的 灰 度 级 归并 到 同 
一 个 灰 度 级 上 ， 从 而 造成 灰 度 间 隔 的 扩大 。 此 外 ， 由 于 不 能 将 同一 个 灰 度 值 的 各 个 像素 变换 
到 不 同 灰 度 级 ， 也 导致 直方 图 均衡 化 只 能 是 近似 均衡 直方 图 ， 不 能 实现 理想 的 水 平 直 线 均衡 
结果 ， 并 且 致 使 菜 些 图 像 细 节 消 失 。 
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【 例 3.8】 直方 图 均衡 化 计算 
以 一 幅 64 x64 像素 ，8 个 灰 度 等 级 的 图 像 为 例 ， 进 行 直方 图 均衡 化 计算 ， 其 各 灰 度 级 
的 概率 分 布 见 表 3. 1。 具 体 计 算 过 程 如 下 : 
表 3.1 各 灰 度 级 对 应 的 概率 分 布 














灰 度 级 si 0 1 2 3 4 5 6 了 
像素 nn. 790 1023 850 656 329 245 122 81 
概率 已 = mi 0. 19 0. 25 0.21 0. 16 0. 08 0. 06 0.03 0. 02 





























第 一 步 ， 根 据 表 3. 1 中 的 数据 得 到 原始 图 像 的 直方 图 ， 如 图 3. 22a 所 示 。 利 用 式 (3. 69 ) 
得 到 变换 函数 的 值 为 





0 
so = T(r) = >P(n) =0.19 
j=0 
1 
s1 = T(rn) = >P(n) =0.19 +0.25 = 0.44 
j=0 


sy = T(r,) = > P(r,) = 0.19 +0.25 +0.21 = 0.65 
依次 类 推 ， 可 得 到 
ss = 0.81,s, = 0.89,s, = 0.95,s, = 0.98,s, = 1.0 
这 样 变 换 函 数 T(r ) 与 灰 度 级 s, 之 间 的 关系 曲线 如 图 3. 22b 所 示 。 
第 二 步 ， 采 用 公式 s, =int[ ( 工 -1)s, +0.5], 将 s, 扩展 到 [0, 二 -1] 范 围 内 并 取 整 ， 可 








得 
5 = 8 = 3 9 S07 E08 ST = 7 
然后 将 相同 的 值 归 并 起 来 ， 即 可 得 到 直方 图 均衡 化 修正 后 的 灰 度 级 ， 依 次 为 
So = 0 
由 此 可 知 ， 经 过 变换 后 的 灰 度 级 不 需要 8 个， 只 需 5 个 就 够 了 。 把 相应 的 原 灰 度 级 像素 数 相 
加 即 可 得 到 新 灰 度 级 的 像素 数 ， 统 计 新 直方 图 各 灰 度 级 像素 为 
no = 790,n’ = 1023,n’ = 850,n’ = 985,n’ = 448 
第 三 步 ， 确 定 7 一 54 的 映射 




















7o 一 350 一 790 
站 一 5 一 1023 
7 一 5 一 850 
7 ,7 一 5 一 0536 +329 = 985 
7 75o7 54>245 + 122 +81 = 448 
第 四 步 ， 新 灰 度 级 分 布 
P.(so) = 790/4096 = 0.19,P.(s) = 1023/4096 = 0.25， 
P.(s,) = 850/4096 = 0.21,P(S) = 985/4096 = 0.24， 
P.(ss) = 448/4096 = 0.11 
第 五 步 ， 均 衡 化 后 的 直方 图 如 图 3. 22c 所 示 。 
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0 1234567 1 2 
a) 原始 图 像 直 方 图 b) 变换 函数 9) 均衡 化 后 的 直方 图 


图 3.22 直方 图 均衡 化 示例 























3.4.3 直方 图 规定 化 方法 


直方 图 均衡 化 方法 的 优点 是 能 自动 增强 整个 图 像 的 对 比 度 ， 处 理 的 结果 是 得 到 全 局 均衡 
化 的 直方 图 。 但 实际 应 用 中 ,往往 需 要 将 直方 图 变 成 特定 的 形状 ， 从 而 有 选择 地 增强 某 个 灰 
度 值 范围 内 的 对 比 度 ， 或 使 图 像 灰 度 值 的 分 布 满足 特定 的 需求 。 这 种 增强 的 方法 称 为 直方 图 
规定 化 方法 。 直 方 图 规定 化 方法 的 基本 原理 与 直方 图 均衡 化 方法 非常 类 似 ， 两 者 的 不 同 主要 























取 有 意义 的 特定 直方 图 。 直 方 图 规定 化 方法 有 如 下 几 个 计算 步骤 : 

1) 列 出 原始 直方 图 灰 度 级 7; 

2) 统计 原始 直方 图 各 灰 度 级 像素 ni; 

3) 根据 式 (3. 68 ) 计算 原始 直方 图 ; 

4) 根据 式 (3. 69) 计 算 原始 图 像 的 累积 分 布 直方 图 P,(m) ; 

5) 根据 实际 需求 规定 需要 的 直方 图 各 项 P,(w); 

6) 根据 规定 的 直方 图 ， 根 据 式 (3. 69 ) 计 算 其 累积 直方 图 P, (wu); 

7) 根据 变换 函数 将 原始 直方 图 对 应 映射 到 规定 的 直方 图 。 最 常见 的 为 单 映 射 规则 (Sin- 
gle Mapping Law，SML) 和 组 映射 规则 ( Group Mapping Law，GML)。 

单 映 射 规则 及 其 变换 函数 : 先 找 到 使 下 式 取得 最 小 值 的 上 和 1 


k I 
| > PG) - > PB) |= Ul M0 l= (3.70) 
i=0 j=0 


然后 ， 将 P(r,) 对 应 到 P,(w) 去 。 单 映射 规则 方法 简单 直观 ,但 有 时 会 产生 较 大 的 取 整 误 
差 。 

组 映射 规则 及 其 变换 函数 : 设 有 一 个 整数 函数 1(1) ,满足 0<1(0)<…I(N-1)<M 
+1， 找 到 能 使 下 式 达 到 最 小 值 的 17(7) 


1(1) I 
| Pn > pty ek sl 0 (3.71) 
k=0 j=0 


如 果 1=0， 则 将 其 从 0 到 7(0) 的 P(r) 对 应 到 P,(w) 去 。 如 果 1>0， 则 将 其 从 7(1-1) 
+1 到 7(7) 的 P(ri) 对 应 到 P,(w) 去 。 

可 见 ， 单 映射 规则 的 映射 方向 是 将 原始 累积 直方 图 中 的 各 项 映射 成 规定 的 累积 直方 图 的 
各 项 。 在 映射 过 程 ， 每 次 都 按 “ 最 近邻 ”的 原则 进行 ， 将 用 最 靠近 已 , (wi) 的 P,(r,) 代 圭 
P (us)。 而 组 映射 规则 的 映射 方向 与 单 映射 规则 相反 ， 将 规定 的 累积 直方 图 中 的 各 项 映射 
成 原始 的 累积 直方 图 中 的 各 项 。 在 映射 过 程 ， 每 次 也 是 按 “ 最 近邻 ”的 原则 进行 。 

【 例 3.9】 直方 图 规定 化 计算 示例 。 
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仍 使 用 直方 图 均衡 化 的 [ 例 3.7】 来 进行 直方 图 规范 化 的 计算 ， 并 假设 图 3. 23b 为 期 望 的 
直方 图 。 可 见 ， 在 新 的 直方 图 中 ， 图 像 的 像素 值 只 有 1、3、5、7 四 个 像素 。 
(1) ~ (4) 由 于 原始 图 像 的 直方 图 计算 同 灰 度 均衡 化 的 [ 例 3.7】， 这 里 就 不 再 进行 计算 。 
(5) 计算 规定 的 直方 图 

















Po 二 本 全 二 jo,P(u =3) = ,Pl = 5) = ,PCu = 7) = 元 
(6) 计算 规定 的 累积 直方 图 

a oP Tn 寺 ,P i 3,P, re 
(7) 直方 图 映射 


UL 
忆 (m) = 与 :PR , (wo) 最 为 靠 ， 因 此 P(7) 一 P, (uo)， 即 ro 一 uo 


-i 
P,(n) = 高， 与 P(tw) 最 为 靠近 ,因此 PCn) 一 Pi) ， 即 mm 


P,(n) = 让 与 P。 ,(u ) 最 为 靠 ， 因 此 P(r,) 一 P， (ui), 即 疡 一 总 





同 理 的 二 的 人 
可 见 根据 规定 的 直方 图 ， 按 照 单 映射 规则 ， 原 始 灰 度 将 按 如 下 规则 映射 成 新 的 灰 度 值 : 
0 一 1 ，1 一 3 ，2 一 3 ，3 一 3 ，4 一 3 ，S 一 3 ，6 一 3 ，7 一 7 
也 就 是 说 ， 在 新 的 图 像 中 ， 四 个 新 的 灰 度 级 分 别 拥 有 的 像素 数 为 3、5、5、3。 图 3. 23c 所 示 
为 采用 组 映射 后 的 图 像 灰 度 分 布 。 若 采用 组 规则 进行 ， 其 直方 图 映射 的 过 程 可 以 描述 为 


P,(w =1) =i6, 与 P(r ) 最 为 靠 ， 因 此 P(n) 一 P, (uw,)， 即 mr 一 un 

















PC =3) -= 到， 与 P,(m ) 最 为 靠近 ， 因此 P(r) 一 P,(w,), 即 六 一 zw 





P,(u, =5) = 一 ,与 P (zs) 最 为 靠近 ， 因 此 六 一 刀 TU， TU 


Pu (oa =7) =1, 与 P,(w ) 最 为 靠近 ， 因 此 reo>ws,， rj 于 
可 见 根据 规定 的 直方 图 ， 按 照 组 映射 规则 ， 原 始 灰 度 将 按 如 下 规则 映射 成 新 的 灰 度 值 ; 
0 一 ] ，1 一 3 ，2 一 3 ，3 一 5 ，4 一 9 ，5 一 3 ，0 一 7 ，7 一 7 
也 就 是 说 ， 在 新 的 图 像 中 ， 四 个 新 的 灰 度 级 分 别 拥有 的 像素 数 为 3、3、5、5。 图 3.23d 
给 出 了 采用 组 映射 后 的 图 像 灰 度 分 布 。 
从 这 个 例子 可 以 看 出 ， 采 用 单 映射 规则 与 组 映射 规则 所 得 到 的 最 终结 果 可 能 是 不 相同 
的 。 一 般 而 言 ， 采 用 组 映射 规则 会 得 到 比 采 用 单 映射 规则 更 接近 规定 直方 图 的 结 


3.4.4 频 域 增强 


频 域 增强 通过 对 图 像 做 侍 里 叶 变 换 ， 将 图 像 变换 到 频 域 ,然后 有 选择 地 增强 某 些 频段 ， 
再 进行 依 里 叶 反 变换 得 到 增强 图 像 。 小 波 域 增强 通过 对 图 像 做 小 波 变 换 ， 然 后 增强 小 波 分 解 
的 高 频 分 量 ， 再 进行 小 波 重 构 ， 即 得 到 增强 图 像 。 流 程 如 下 : 
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4/16 上 
3/16|- 3/16[ 
2/16[ 2/16 
1716F | | | | [| 1/16r- 
1234567 1 1 3 5 7 1 3 5 7 
a) 原始 图 像 直方 图 b) 规定 的 图 像 直 方 图 0) 采用 单 映射 规则 d) 采 用 组 映射 规则 
的 图 像 直方 图 的 图 像 直方 图 


图 3.23 直方 图 规定 化 计算 实例 
原始 图 像 一 变换 域 一 增强 一 反 变换 一 增强 图 像 
1. 频 域 高 通 滤波 锐 化 
频 域 锐 化 主要 是 通过 频 域 高 通 滤波 进行 的 。 从 频谱 的 角度 看 ， 图 像 模糊 的 实质 是 其 高 频 
部 分 被 衰减 ， 因 此 可 以 用 高 频 滤波 来 使 图 像 更 加 清晰 。 高 频 滤波 带 衰 减 傅 里 叶 变 换 中 的 低频 
部 分 ， 而 高 频 部 分 则 无 损 地 通过 。 与 低 通 滤波 器 相对 应 ， 在 高 通 滤 波 顺 中 常用 的 传递 函数 
H(u, v) 有 以 下 儿 种 。 
(1) 理想 高 通 Vo ee, High Pass Filter, IHPF) 
一 个 二 维 理想 高 通 滤 波 器 的 传递 函数 有 (wu， vw) 的 表达 式 为 
0 D(u,v) < DD, 
H(u,v) = (3.72) 
1 D(u,v) > D, 
式 中 ，D 为 截止 频率 ; D(w, vw) 为 点 (u,v) 到 频率 平面 原点 的 距离 。 理 想 高 通 滤 波 器 传递 
函数 的 特性 曲线 如 图 3. 24a 所 示 。 可 见 ， 这 个 滤波 央 与 理想 低 通 滤 波 央 的 特性 正好 完全 相 
bs 它 把 半径 为 D, 的 圆 内 所 有 频率 完全 衰减 ， 对 圆 外 的 所 有 频率 则 无 损 通 过 。 同 理 ， 理 想 
通 滤波 融 在 物理 上 也 是 不 能 实现 的 ， 只 能 用 计算 机 进行 模拟 。 
(2) 巴特 沃 思 高 通 滤波 
具有 截止 频率 Du 的 于 阶 巴特 沃 思 高 通 滤波 器 的 传递 函数 为 
1 
1 + [D/D(u,0) J]™ 
式 中 ，D(wu, v) 仍 由 式 (3.44) 或 式 (3.45) 定 义 。 巴 特 沃 思 高 通 滤 波 器 传递 孙 数 的 特性 曲线 
如 图 3. 24b 所 示 。 
当 D(wu,v) = Ds 时,H(w,v) 下 降 到 最 大 值 的 1/2。 如 同 巴 特 沃 思 低 通 滤波 器 的 情形 一 样 ， 
果 截 止 频率 的 如 (wz) 为 最 大 值 的 1/2 ， 则 式 (3. 73 ) 可 以 化 简 为 
1 
a 1 + (2 -1)[D/Du,v) 1 本 
(3) 指数 高 通 滤波 带 ( Exponent High Pass Filter，EHPF ) 
有 具 有 截止 频率 Du 的 指数 高 通 滤波 带 其 传递 函数 表达 式 为 
H(u,v) = el2o20e (3.75) 
式 中 , D(w,v) 可 由 式 (3. 44 ) 或 式 (3. 45 ) 表示 ; n 控制 着 指数 函数 的 增长 率 。 指 数 高 通 滤波 
器 传递 函数 的 特性 曲线 如 图 3. 24c 所 示 。 
当 D(wu,v) = Do 时,H(w,v) 下 降 到 最 大 值 的 1/2。 如 同 指数 低 通 滤波 器 的 情形 一 样 ,如 果 
































H(u,v) = (3.73) 
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截止 频率 的 了 (u,v) 为 最 大 值 的 1/42， 则 式 (3.75 ) 可 以 化 简 为 
H(u,v) = el™a} ?Dl (3.76) 
(4) 梯形 滤波 需 (Trapezia High Pass Filter，THPF) 
梯形 高 通 滤 波 器 的 传递 函数 表达 式 为 





0 D(u,v) < D, 
0 EE (3.77) 
Do -DD 
1 D(u,v) > DD 


式 中 , D(z,z) 仍 由 式 (3. 44) 或 式 (3.45) 定 义 ; DD, 为 截止 频率 。 图 3. 24d 所 示 为 典型 的 梯形 
高 通 滤波 器 传递 函数 的 特性 曲线 。 


[C4 1 


a) 理想 高 通 滤波 器 b 巴特 深思 高 通 洪波 器 。 c) 指数 高 通 滤波 器 d) 梯形 高 通 滤波 器 
图 3.24 各 种 高 通 滤波 器 的 特性 曲线 

2. 同 态 滤波 

同 态 滤波 一 种 增强 图 像 对 比 度 的 频 域 处 理 方法 ， 尤 其 适合 于 处 理由 于 光照 不 均 导 致 的 图 
像 不 清 。 它 与 图 像 成 像 模型 有 密切 关系 。 因 此 在 介绍 同 态 滤波 之 前 ， 先 简单 介绍 一 下 图 像 的 
成 像 原 理 。 

人 之 所 以 能 够 看 到 某 个 物体 ， 是 因为 有 光照 射 在 物体 上 ， 物 体 将 入 射 光 沿 着 一 定 方向 进 
行 反 射 或 透射 。 反 射 /透射 光 进 入 人 有 眼 后 在 视网膜 上 产生 感知 信号 。 该 感知 信号 沿 着 视神经 
传送 到 大 脑 后 形成 物体 的 像 。 按 照 图 像 的 成 像 原理 ， 可 以 将 图 像 函 数 f(x,y) 分 为 两 部 分 :人 
射 到 可 见 场景 上 的 光 i(x,y) 和 场景 中 物体 对 入 射 光 的 反射 /透视 ,前 者 也 称 为 照度 分 量 、 照 射 
分 量 ,后 者 用 反射 率 或 透射 率 r(x,y) 表示 ， 也 称 为 反射 分 量 。 因 此 可 以 将 一 幅 图 像 进行 如 下 
简单 建 模 : 


0 <i(x,y) < oo 


区 = i(x,yY)r(x 3.78 
fx,y) = i(x,y) r(x,y) ee (3.78) 


式 中 ,i(%,y) 的 值 由 光源 决定 ;反射 率 r(x,y) 由 场景 中 的 物体 的 属性 决定 ， 取 值 范围 在 全 吸 
收 (0) 和 全 反射 (1) 之 间 。 

在 一 幅 图 像 中 ， 反 射 分 量 决 定 图 像 的 内 容 ， 随 图 像 细节 的 不 同 在 空间 上 作 快 速 变化 。 而 
照度 分 量 在 空间 则 通常 具有 缓慢 变化 的 性 质 。 所 以 照度 分 量 的 频谱 分 布 在 低频 区 域 ， 而 反射 
分 量 的 频谱 则 大 部 分 分 布 在 空间 的 高 频 区 域 。 为 了 增强 图 像 的 细节 表现 ， 必 须 改 善 照度 分 量 
和 反射 分 量 的 分 布 。 

同 态 滤波 以 式 (3. 78) 所 给 的 图 像 模 型 为 基础 ， 在 频 域 中 同时 进行 图 像 对 比 度 增强 和 压 
缩 图 像 亮 度 范 围 。 其 基本 思想 是 ， 将 图 像 模 型 的 两 个 分 量 分 开 ， 在 频 域 中 选择 适当 的 滤波 带 
参数 H(u,v) ,在 抑制 图 像 低频 信号 i(x,y) 的 同时 加 强 其 高 频 信 息 r(x,y) 。 最 后 将 频 域 信号 
反 变 换 到 空间 域 即 可 得 到 预期 的 效果 。 

为 了 把 照度 分 量 和 反射 分 量 分 开 处 理 ， 一 种 方法 就 是 对 式 (3. 78 ) 进行 对 数 变换 ， 这 样 
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到 3.25 图 像 模型 示意 




















就 可 以 把 两 者 混合 在 一 起 的 乘法 运算 转变 成 两 者 分 离 的 加 法 运算 。 然 后 在 频 域 中 抑制 低频 照 


度 yee 最 后 再 将 处 理 结 果 反 变换 到 空 
滤波 的 基本 流程 如 图 3. 26 所 示 。 


间 域 中 ， 从 而 得 到 预期 的 效果 。 同 态 














1) 首先 对 式 (3.78) 的 成 像 模型 两 边 取 对 数 ， 即 











图 3.26 同 态 滤波 的 流程 





lnf(x,y) = lni(x,y) + lnr(x,y) (3. 79 ) 
2) 对 式 (3.79) 进 行 正 向 传 里 叶 变 换 ， 即 
Fl(u,v) = TI(u,v) + R(u,v) (3. 80) 
3 ) 选择 一 个 适当 的 频 域 函 数 H(u,v) 进行 滤波 ， 即 
Hl(u,v Fu,v) = Hu,v)I(u,v) + Hu,v)R(u,v) (3.81) 
4) 根据 需要 对 滤波 后 的 数据 进行 处 理 。 下 
5) 将 处 理 后 的 频 域 结果 经 过 传 里 叶 反 变换 转换 ’H 
到 对 数 空间 域 里 ， 则 有 下 
h(x,y) = h(x,y) +h(x,y) (3.82) 
6) 将 式 (3. 82) 进 行 指数 变换 ， 得 到 数字 图 像 所 
在 的 空间 ， 即 


g(x,y) = exp | Pr(xy) | 
= exp |h,(x,y) | exp |h,(x,y) | (3. 83) 
可 见 , 及 Cu) 的 选择 决定 了 同 态 滤波 的 效果 ,为 
了 能 够 在 抑制 低频 的 同时 加 强 高 频 信息 ,H(u,v) 通 











DD 
图 3.27 同 态 滤波 器 圆 对 称 滤波 函数 的 
剖面 图 , D(w,v) 表示 点 (u,v) 
离 原 点 的 距离 
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常 在 低频 部 分 小 于 1, 而 在 高 频 部 分 大 于 1, 图 3.27 给 出 了 一 个 满足 上 述 要 求 的 滤波 函数 前面 
图 ,将 它 绕 纵 轴 旋转 360° 即 得 到 完整 的 二 维 H(w,v) 。 

【 例 3.10】 用 同 态 滤波 增强 

在 图 3. 28a 所 示 的 原始 图 像 中 ， 掩 体内 部 的 细节 被 遮 项 。 图 3. 28b 所 示 为 用 同 态 滤波 器 
处 理 的 结果 ， 其 中 滤波 函数 y =0.5，y =2.0， 减 小 了 亮度 的 动态 范围 ， 增 强 了 对 比 度 可 
以 使 掩体 内 的 细节 显示 出 来 ， 并 且 平 衡 墙 外 的 灰 度 。 增 强 后 的 图 像 更 加 锐 化 。 




















a) 原始 图 像 b) 用 同 态 滤波 器 处 理 后 的 图 像 





图 3.28 ” 同 态 滤波 增强 











第 4 章 图 像 分 市 


在 对 各 种 机 器 视觉 测量 技术 的 研究 应 用 中 ， 人 们 往往 仅 对 图 像 中 的 某 些 部 分 感 兴趣 。 这 
些 部 分 常常 被 称 为 前 景 或 目标 ， 其 他 部 分 被 称 为 背景 。 表 示 同 一 类 物体 的 目标 区 域 往往 拥有 
某 些 独 特 的 性 质 ， 例 如 灰 度 、 轮 廊 、 纹 理 、 频 谱 或 直方 图 等 相近 或 相同 。 为 了 实现 对 目标 的 
分 析 ， 必 须 将 目标 从 整个 图 像 中 分 离 出 来 。 如 何 准确 、 可 靠 地 实现 目标 的 分 离 就 是 图 像 分 割 
要 研究 的 主要 内 容 。 图 像 分 割 的 好 坏 直接 影响 着 后 续 图 像 测 量 的 效果 ， 在 视觉 测量 中 占有 关 
键 地 位 。 本 章 在 介绍 图 像 分 割 基本 概念 的 基础 上 ,重点 介绍 几 种 基本 的 、 典 型 的 图 像 分 割 算 
法 ,例如 边缘 分 割 法 、 立 值 分 割 法 、 区 域 分 割 法 等 。 


4.1 图 像 分 割 概述 


1. 图 像 分 割 概念 

图 像 分 割 就 是 根据 像素 的 灰 度 、 颜 色 、 纹 理 等 特性 按照 一 定 的 原则 将 一 幅 图 像 或 景物 分 
割 成 若干 个 特定 的 、 具 有 独特 性 质 的 部 分 或 子 集 ， 并 提取 出 感 兴趣 目标 的 技术 和 过 程 。 与 很 
多 其 他 计算 机 技术 类 似 ， 图 像 分 割 也 没有 统一 的 定义 ， 不 同 的 人 可 能 有 不 同 的 解释 和 表述 。 
下 面 给 出 一 个 借助 于 集合 概念 描述 的 图 像 分 制定 义 : 

令 集 合 尺 代表 整个 图 像 区 域 ， 对 尽 的 分 割 可 看 作 将 RR 分 成 NN 个 满足 以 下 五 个 条 件 的 非 
空子 集 ( 子 区 域 )R,,，R,,…,， Ry: 

1) UR = Ri 

2) 对 所 有 的 i 和 j, ij, 有 RNR=D; 

3) 对 i=1, 2, …, N,， 有 P(R,) = true ; 

4) 对 i ,， 有 P(R,U R,) = false ; 

5) 对 i=1，2，…，N，R, 是 连通 的 区 域 。 
其 中 , P(R,) 是 对 所 有 在 集合 RR, 中 元 素 的 逻辑 谓词 ，O 代 表 空 集 。 条 件 1 ) 指 出 分 割 所 得 到 的 
全 部 子 区 域 的 总 和 (并 集 ) 应 能 包括 图 像 中 所 有 的 像素 条 件 ; 条 件 2) 指 出 分 割 后 属于 同一 区 
域 的 像素 应 该 具有 某 些 相同 特性 ; 条 件 3) 指 出 各 个 子 区 域 是 互 不 重合 的 ， 或 者 一 个 像素 不 
能 同时 属于 两 个 区 域 ; 条 件 4) 指 出 分 割 后 得 到 的 属于 不 同 区 域 的 像素 应 该 具有 不 同 的 特性 ， 
即 没 有 共性 ; 条 件 5 ) 要 求 同 一 个 子 区 域内 的 像素 应 该 是 连通 的 。 需 要 说 明 的 是 ， 实 际 的 视 
觉 测 量 系 统 都 是 针对 某 种 特定 的 应 用 背景 的 ， 所 以 条 件 中 的 各 种 关系 也 是 根据 实际 需求 而 设 
定 的 。 迄 今 为 止 ， 还 没有 一 种 通用 的 图 像 分 割 方法 。 在 不 同 领域 中 有 时 也 用 其 他 名 称 ， 如 目 
标 轮廓 技术 、 阔 值 化 技术 、 图 像 区 分 或 求 差 技 术 、 目 标 检测 技术 、 目 标识 别 技术 、 目 标 跟 踪 
技术 等 。 这 些 本 身 或 核心 实际 上 都 是 指 图 像 分 市 技术 。 

简 言 之 ， 图 像 分 割 就 是 聚 类 ， 将 图 像 中 不 同 的 区 域 进行 分 类 ， 进 而 提取 目标 。 只 有 找到 
目标 才能 对 目标 进行 测量 等 后 续 处 理 。 这 是 一 项 具有 挑战 性 的 工作 ， 是 图 像 测量 中 最 重要 的 
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环节 之 一 。 尤 其 是 复杂 背景 下 的 图 像 分 割 ， 其 难度 更 大 。 图 像 处 理 在 图 像 工 程 中 属于 图 像 分 
析 层 次 。 

2. 图 像 分 割 准则 






























































从 分 割 的 角度 看 ， 图 像 分 割 有 两 个 重要 的 阔 值 分 害 
分 割 准则 : 相 邻 像素 之 间 的 相似 性 和 非 连续 区 域 分 裂 与 合并 
性 。 根 据 分 割 时 所 依据 的 分 割 准则 ， 可 以 将 现 和 区 城 的 和 区 
有 的 分 割 方法 分 为 如 图 4 1 所 示 的 两 大 类 : 基 (相似 性 ) | 汉代 国信 
于 不 连续 性 的 边缘 分 割 算法 和 基于 相似 性 的 区 和 
域 分 割 算法 。 其 中 相似 性 的 区 域 分 割 就 是 将 具 图像 分 割 < a 
有 同一 特性 的 像素 聚集 在 一 起 ， 形 成 一 个 目 MT 
标 ; 基于 不 连续 性 的 边缘 分 割 就 是 首先 检测 局 a 模板 匹配 
部 不 连续 性 ， 然 后 把 它们 连接 在 一 起 形成 边 We 小 波多 尺度 检测 
界 ， 根 据 边界 将 图 像 分 割 成 不 同 的 区 域 。 随 着 数学 形态 学 检测 
计算 机 处 理 能 力 的 提高 ， 很 多 方法 不 断 涌现 ， I 
如 基于 彩色 分 量 分 割 、 纹 理 图 像 分 割 。 另 外 所 图 4 1 图像 分 割 方法 分 类 








使 用 的 数学 工具 和 分 析 手 段 也 是 不 断 扩展 的 ， 从 时 域 信号 到 频 域 信号 处 理 、 小 波 变换 等 。 

3. 图 像 分 割 方法 分 类 

分 割 过 程 中 主要 有 两 种 处 理 策略 : 并 行 算法 和 串 行 算法 。 并 行 算 法 中 所 用 判断 和 决定 都 
可 独立 和 同时 做 出 ， 串 行 算法 中 早期 的 人 处理 结 果 可 被 其 后 的 处 理 过 程 所 利用 。 

(1) 并 行 边界 分 割 技术 

主要 指 图 像 边缘 检测 技术 。 包 括 如 下 两 个 步 又 : 

1) 检测 目标 的 边缘 点 。 

2) 根据 检测 的 边缘 点 连接 边缘 ， 组 成 目标 的 边界 。 

(2) 并 行 区 域 分 割 技 术 

并 行 区 域 分 割 技术 主要 有 两 种 方法 : 

1) 阐 值 化 算法 ” 立 值 化 算法 是 图 像 分 割 中 算法 数量 最 多 的 一 类 。 

2) 特征 空间 聚 类 ”例如 彩色 图 像 分 割 ， 通 过 像素 的 颜色 特征 ， 将 目标 分 割 出 来 。 以 足 
球 机 器 人 色 标 为 例 。 从 某 种 意义 上 说 ， 像 素 特征 空间 聚 类 可 以 看 成 是 浆 值 化 技术 的 推广 。 有 
些 多 维特 征 空间 分 类 问题 也 可 转化 为 多 次 阔 值 分 割 来 处 理 。 图 像 冰 值 化 和 特征 空间 聚 类 的 直 
接 结 果 是 把 图 像 中 各 个 区 域 分 开 ， 把 其 中 的 目标 区 域 提取 出 来 ， 还 需要 对 各 区 域 进行 识别 标 
记 。 

(3) 串 行 区 域 分 割 技术 

串 行 区 域 分 割 技术 是 指 采用 串 行 处 理 的 策略 ， 通 过 对 目标 区 域 的 直接 检测 来 实现 图 像 分 
割 的 技术 。 

串 行 分 割 方法 的 特点 是 将 整个 处 理 过 程 分 解 为 顺序 的 多 个 步骤 逐次 进行 。 其 中 ， 对 后 续 
步 又 的 处 理 要 根据 前 面 已 完成 步骤 的 处 理 结 果 进 行 判 断 而 确定 。 其 判断 是 要 根据 一 定 的 准则 
来 进行 的 。 例 如 ， 如 果 准 则 是 基于 图 像 灰 度 特征 的 ， 则 该 方法 可 用 于 灰 度 图 像 的 分 割 ; 如 果 
准则 是 基于 图 像 的 其 他 特性 ( 如 纹理 ) 的 ， 则 该 方法 可 用 于 相应 图 像 的 分 割 。 串 行 区 域 分 割 
技术 有 两 种 基本 形式 : 
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1) 从 单个 像素 出 发 ， 逐 渐 合 并 以 形成 所 需 的 分 割 区 域 。 

2) 从 全 图 出 发 ， 逐 渐 分 裂 切割 至 所 需 的 分 割 区 域 。 

4. 图 像 分 割 评价 

(1) 图 像 分 割 评价 要 求 

图 像 分 割 评价 可 以 分 成 两 种 情况 : 

1) 性 能 刻画 ”掌握 某 种 算法 在 不 同 分 割 情况 中 的 表现 ， 以 通过 选择 算法 参数 来 适应 分 
市 具有 不 同 内 容 的 图 像 和 分 割 在 不 同 条 件 下 采集 的 图 像 的 需要 。 

2) 性 能 比较 ”比较 不 同 算法 在 分 割 给 定 图 像 时 的 性 能 ， 以 帮助 在 具体 分 割 应 用 中 选取 
合适 的 算法 或 改进 已 有 算法 。 

为 达到 分 制 评 价 的 目的 ， 对 评价 方法 要 有 如 下 要 求 : 

1) 应 具有 广泛 的 通用 性 ， 即 评价 方法 要 适用 于 评价 不 同类 型 的 分 割 算法 ， 并 适合 各 种 
应 用 领域 情况 。 

2) 应 采用 定量 和 客观 的 性 能 评价 准则 ， 这 里 的 定量 是 指 可 以 精确 地 描述 算法 的 性 能 ， 
客观 是 指 评判 要 摆脱 人 为 因素 。 

3) 应 选取 通用 图 像 进行 测试 以 使 评价 结果 具有 可 比 性 和 可 移植 性 ， 同 时 这 些 图 像 应 尽 
可 能 地 反映 客观 世界 的 真实 情况 和 实际 应 用 领域 的 特点 。 

(2) 图 像 分 割 评价 准则 

图 像 分 割 评价 要 基于 一 定 的 评价 准则 ， 也 称 评价 指标 或 测度 。 评 价 准则 可 以 分 成 分 析 准 
则 和 实验 准则 ， 也 可 分 成 定性 准则 和 定量 准则 。 因 此 ， 综 合 起 来 可 分 成 如 下 准则 : 

1) 定性 的 分 析 准 则 ; 

2) 定性 的 实验 准则 ; 

3) 定量 的 分 析 准 则 ; 

4) 定量 的 实验 准则 。 

其 中 ， 定 量 分 析 准 则 比 定性 分 析 准 则 可 以 获得 对 所 评价 算法 更 精确 的 信息 。 但 定性 分 析 
准则 不 需要 用 计算 机 具体 实现 算法 ， 并 且 评价 结果 不 会 受到 评价 实验 的 影响 。 


(3) 图 像 分 割 评价 框架 
| 
它 主 要 包括 三 个 模块 ， 实际 特征 值 


分 割 算法 评价 的 框架 示意 图 ， 
2) 图 像 合成 ; 


3) 莽 法 测试 。 图 4 2 图 像 算法 分 割 评价 框架 示意 图 

有 关 分 析 目 的 、 评 价 要 
求 、 图 像 获取 及 处 理 条 件 和 因素 ， 可 以 有 选择 地 结合 进 这 个 框架 ， 因 此 它 可 以 适用 于 各 种 应 
用 领域 。 同 时 ,研究 分 制 算法 时 只 需要 用 到 图 像 分 割 的 结果 ， 所 以 这 一 框架 可 适用 于 所 有 分 
割 算法 。 为 了 进一步 说 明 上 述 框 架 的 含义 ， 下面 通 过 实例 进行 说 明 。 

【 例 4.1】 噪声 污染 图 像 的 某 种 图 像 分 割 算法 性 能 评价 

分 析 目 的 : 评价 在 不 同 种 类 、 不 同 强度 噪声 污染 情况 下 该 图 像 分 割 算法 的 性 能 。 

干扰 因素 : 不 同 种 类 、 不 同 强度 噪声 ， 如 高 斯 噪声 、 椒 盐 品 声 。 

































































评价 结果 
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图 像 合成 : 采用 标准 图 像 ， 如 lena 图 ， 加 入 不 同 均值 和 方差 的 高 斯 噪声 或 加 入 不 同 密度 
的 椒盐 噪声 形成 测试 样本 图 像 。 

试验 图 像 : 加 入 噪声 的 测试 样本 图 像 。 

评价 要 求 : 图 像 分 割 的 评价 指标 及 根据 评价 指标 需 评 价 的 效果 。 

原始 特征 值 : 未 加 入 噪声 的 原始 图 像 的 特征 值 。 

实际 特征 值 : 噪声 污染 网 像 的 特征 值 。 

待 测算 法 : 待 评价 的 图 像 分 割 方法 。 

算法 测试 : 将 算法 作用 于 噪声 污染 的 样本 图 像 。 

性 能 分 析 评 判 : 根据 评价 要 求 ， 对 比 原 始 特征 值 和 实际 特征 值 ， 给 出 评价 结果 的 过 程 。 
与 其 他 图 像 分 割 方法 的 分 割 结 果 进 行 比较 。 

评价 结果 :对 图 像 分 割 方法 性 能 和 效果 的 评价 。 


4.2 间断 检测 


数字 图 像 包 括 三 种 基本 类 型 的 灰 度 级 间断 : 点 、 线 、 边 缘 。 点 、 线 检测 属于 数字 图 像 中 
灰 度 级 间断 检测 技术 。 间 断 检测 要 保证 两 点 : 

1) 检测 出 间断 ; 

2) 平坦 区 域 输出 为 零 。 

本 音 主 要 介绍 点 、 线 间断 检测 的 模板 匹配 法 。 

寻找 间断 的 最 一 般 方 法 是 对 整 幅 图 像 使 用 一 个 模板 进行 检测 ,这 | 两 | 的 | 琴 
一 过 程 包 括 计 算 模板 所 包围 区 域内 灰 度 级 与 模板 系数 的 乘积 之 和 。 对 | ww | ws | wm 



































































































































于 图 4.3 所 示 的 3 x3 模板 ， 在 图 像 中 任意 点 的 模板 响应 为 

R= Wz + Ws + Ws = 2 Wi (4.1) ”图 4.3 一 般 的 
式 中 ，: 是 与 模板 系数 和 相对 应 的 像素 灰 度 级 。 下 面 分 别 讨论 点 、 0 
线 的 检测 模板 。 


1. 点 的 检测 模板 

点 检测 就 是 检测 图 像 中 的 孤立 点 。 所 谓 孤 立 点 就 是 图 像 中 有 一 点 ， 灰 度 值 与 其 他 地 方 不 
同 。 孤 立 点 灰 度 值 与 周围 灰 度 值 可 以 相差 很 大 ， 也 可 以 相差 不 大 。 

图 像 中 的 孤立 点 检测 方法 很 简单 的 。 假 设 丸 是 点 (x，y) 的 模板 响应 输出 ， 如 果 模 板 输 
出 满足 如 下 条 件 : 





























gxy) ET 或 gcy)1 三 了 (4.2) 
则 认为 (x，y) 处 的 像素 是 一 个 孤立 点 ， 其 中 7 是 一 个 非 负 阅 值 。 图 4.4 给 出 了 一 个 常用 的 
点 检测 模板 。 该 模板 一 般 用 于 背景 强度 恒定 、 目 标 图 像 灰 度 相 同 或 基本 
相同 的 图 像 中 。 在 点 模板 遍历 整理 图 像 进行 检测 时 ， 在 每 一 个 位 置 计 算 
模板 与 所 覆盖 图 像 区 域 的 响应 。 如 果 g(x,y) = 0 ， 说 明 模板 位 于 背景 | -1 | 8 | -1 
区 或 目标 区 的 内 部 ， 当 g(x,y) 堵 0 时 ,说 明 模 板 所 覆盖 的 图 像 区 域内 一 | 一 
既 有 前 景 也 有 背景 ; 当 g(x,y) 值 最 大 时 ,说 明 模 板 正好 位 于 目标 与 前 
景 的 交界 处 。 当 模板 离开 边缘 与 背景 的 交界 时 , g(x,y) 的 值 会 减少 。 图 4.4 点 检测 模板 























一 ] 一 1 一 1 
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【 例 4.2】 孤立 点 的 检测 
图 4. Sa 所 示 为 一 幅 平 坦 区 域 中 有 一 个 孤立 点 的 图 像 ， 孤 立 点 的 灰 度 值 与 周围 相差 不 大 。 
图 4. 5b 所 示 为 经 图 4.4 所 示 模 板 进行 检测 的 结果 ， 图 4. Se 所 示 为 国 值 后 的 结果 (7 了 =2)。 

























































































c) 阔 值 后 的 结果 (7=2) 
图 4.5 基于 模板 的 孤立 点 检测 





2. 线 检测 
图 4.6 给 出 了 几 种 常用 的 线 检测 模板 。 


















































a) 水 平 b)45 方 向 c) 垂直 d) -45" 方 向 


图 4.6 线 检测 模板 
当 上 述 四 个 模板 分 别 在 一 个 图 像 中 遍历 时 ， 如 果 被 背景 灰 度 级 不 变 ， 线 的 宽度 为 1， 那 
么 第 一 个 模板 对 水 平方 向 的 线条 响应 值 最 大 ; 第 二 个 模板 对 于 45 "方向 的 线条 有 最 佳 响应 ; 
第 三 个 模板 对 于 垂直 线 有 最 佳 响应 ; 第 四 个 模板 对 于 -45° 方向 的 线条 有 最 佳 响 应 。 利 用 线 


模板 对 图 像 进 行 检测 的 过 程 如 下 : 
1) 将 模板 沿 着 图 像 从 左 到 右 、 从 上 到 下 进行 遍历 时 ， 在 某 一 位 置 (x,，y) 处 ， 分 别 计算 


四 个 模板 的 匹配 输出 g,(*,y) ， 即 
gz) = 之 2 Wflx + iy +)) (4.3) 


式 中 ， 了 0 是 第 权 模板 的 系数 
2) 将 最 大 答 出 或 绝对 值 最 大 输出 作为 当前 位 置 的 输出 ， 即 
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g(%,y) 二 max|g,(%,y)| (4.4) 
3) 如 果 当 前 输出 g(x,y) 满足 如 下 条 件 : 
gxy) ET 或 | g(x,y)1=7 (4.5) 


则 认为 (x，y) 人 处 的 像素 是 直线 上 的 一 个 点 ， 其 中 7 是 一 个 非 负 阔 值 。 

【 例 4.3】 检测 图 像 中 已 知 方向 的 线 

对 于 图 像 中 已 知 方向 的 线段 ， 可 选 相应 模板 检测 线段 。 已 知 方向 的 直线 检测 示例 如 图 
4.7 所 示 。 图 4. 7a 所 示 为 包含 水 平 线 的 原 图 ， 图 4. 7b 所 示 水 平 模板 检测 结果 ， 图 4. 7c 所 示 
阀 值 化 后 结果 。 
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0) 阔 值 结果 二 10 





图 4.7 已 知 方向 的 直线 检测 示例 

【 例 4.4】 检测 图 像 中 未 知 方向 的 一 条 线 

图 4. 8 所 示 为 未 知 方向 的 直线 检测 示例 。 图 4. 8a 所 示 为 包含 未 知 方向 线 的 原 图 ， 图 
4. 8b ~e 所 示 为 采用 各 个 模板 进行 检测 的 结果 ， 图 4. 8f、g 所 示 为 对 四 个 模板 的 检测 结果 进 
行 综合 处 理 ， 图 4. 8h 为 阅 值 化 后 的 最 终 检 测 结 

综 上 所 述 ， 采 用 模板 检测 图 中 线段 可 分 为 以 下 两 种 情况 : 

(1) 图 像 中 线段 方向 已 知 

采用 与 线段 方向 对 应 的 模板 遍历 图 像 中 各 个 像素 点 ， 获 取 每 一 像素 点 响应 值 ， 平 坦 区 
域 输出 为 零 ， 设 响应 值 图 像 为 RR， 各 像素 响应 值 为 Rj)， 则 R; 三 7 或 | R, | 7 的 像素 点 即 为 
所 求 线段 。 

(2) 图 像 中 未 知 线段 方向 

令 RI，R,，R;，R, 顺序 代表 图 4.8 所 示 模 板 的 响应 图 像 ， (Ri);，(R,);,，(R,),， 
(RR); 为 各 像素 响应 值 。 有 两 种 操作 方法 : 
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d) 垂直 模板 作用 的 结果 
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c) +45 模板 作用 的 
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f) 各 模板 作用 结果 的 最 大 值 


e) -45 模板 作用 的 结果 
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阀 值 化 后 ( 


h) 


结果 的 绝对 值 最 大 值 


8g) 各 模板 作用 
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测 示 


A 人 
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图 4.8 未 知 方向 的 直 


772 

1) 针对 图 像 中 的 每 一 像素 点 ， 分 别 使 用 水 平 、+ 45" 角 、 垂 直 、- 45" 角 模板 计算 响应 
值 (R,); , (RR); ,， (Rs); ，(R,);。 选 择 最 大 的 响应 值 或 绝对 值 最 大 的 响应 值 保留 于 响应 像 
0 




















) 分 别 使 用 水 平 、+ 45" 角 、 垂 直 、-45?" 角 模板 作用 于 图 像 ， 得 到 响应 图 像 R,，R,， 
二 9 最 大 
值 于 响应 像素 。 

【 例 4.5】 特定 方向 上 线 的 检测 

图 4. 9a 所 示 为 一 幅 电 路 接线 模板 的 二 值 图 像 ， 也 可 以 是 灰 度 图 像 ( 单 像素 宽 ) 。 假 设 要 
检测 一 个 像素 宽度 并 且 方 向 为 -45° 的 线条 。 使 用 图 4. 6 所 示 的 -45° 模 板 。 图 4. 9b 所 示 为 
模板 作用 图 像 结果 的 绝对 值 。 图 像 中 所 有 水 平和 垂直 部 分 被 去 除 ， 并 且 图 4. 9b 所 示 原 图 中 
接近 -45° 方 向 的 部 分 产生 了 最 强 响应 。 最 后 通过 设 定 阔 值 保留 检测 的 线段 像素 点 。 
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b) 使 用 -45* 线 检测 模板 c) 对 图 b 设 置 门限 
ee 处 理 后 得 到 的 绝对 值 得 到 的 结果 


图 4.9 线 检测 说 明 























4.3 边缘 检测 


边缘 检测 是 基于 边界 分 割 方法 的 最 基本 人 处理。 图 像 的 边缘 蕴含 了 丰富 的 信息 ， 是 图 像 的 

最 基本 特征 ， 广 泛 地 存在 于 物体 与 背景 之 间 、 物 体 与 物体 之 间 。 从 本 质 上 讲 ， 图 像 边 缘 是 以 

图 像 局 部 特征 不 连续 的 形式 出 现 的 ， 例 如 灰 度 的 突变 、 颜 色 的 突变 、 纹 理 结构 的 突变 等 。 同 

时 ， 物 体 的 边缘 也 是 不 同 区 域 的 交界 处 。 一 般 认 为 ， 沿 图 像 边 缘 方 向 的 灰 度 变化 比较 平缓 ， 

而 边缘 法 线 方向 的 灰 度 变换 比较 剧烈 。 理 想 边缘 模型 如 图 4. 10a 所 示 的 水 平 剖 面 图 ， 称 为 阶 

跃 边缘。 图 像 边 缘 是 清晰 的 。 根 据 这 个 模型 生成 的 边缘 是 一 组 相连 的 单 像素 点 ， 每 个 像素 都 
阶 跃 边 缘 模 型 斜坡 边缘 模型 


< i 
二 


a) 阶 跃 边 缘 剖 面 b) 斜坡 边缘 剖面 (斜坡 部 分 与 边缘 的 模糊 程度 成 比例 ) 


图 4. 10 边缘 模型 
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处 在 灰 度 级 牙 变 垂直 的 台阶 上 。 实 际 边缘 模型 是 如 图 4. 10b 所 示 的 水 平 剖面 图 ， 称 为 斜坡 边 
缘 。 根 据 这 个 模型 边缘 的 点 是 包含 于 斜坡 中 的 任意 点 ， 边 缘 成 为 一 组 彼此 相连 接 的 点 集 。 
由 于 图 像 采 集 过 程 中 光学 系统 成 像 、 数 字 采 样 、 光 照 条 件 等 不 完善 因素 的 影响 ， 实 际 图 
像 边 缘 是 模糊 的 ， 边 缘 剖 面 是 斜坡 状 的 。 和 斜坡 部 分 与 边缘 的 模糊 程度 成 比例 。 边 缘 的 模糊 程 
度 决 定 了 边缘 的 斜 度 ， 边 缘 的 斜 度 决定 了 从 初始 灰 度 级 路 变 到 最 终 灰 度 级 的 斜坡 长 度 ， 和 斜坡 
长 度 决定 了 边缘 的 宽度 。 模 糊 的 边缘 使 边缘 越 宽 ， 清 晰 的 边缘 使 边缘 越 罕 。 
根据 图 像 的 边缘 特点 ， 可 以 将 图 像 边缘 分 为 如 图 4. 11 所 示 的 几 种 基本 类 型 : 


mn ED 旺 卫 全 
a 


te el 
二 阶 导数 | | 人 人 人 让 Hu 


图 4.11 边缘 和 导数 示例 

阶 路 型 、 脉 冲 型 、 屋 顶 形 等 不 同类 型 的 边缘 ， 其 相应 的 性 质 也 不 同 。 阶 路 型 边缘 处 于 图 
像 中 两 个 具有 不 同 灰 度 值 的 相 邻 区 域 之 间 ， 其 灰 度 变化 曲线 的 一 阶 导数 在 边缘 处 出 现 极 值 ， 
而 二 阶 导数 在 边缘 处 出 现 零 交叉 。 脉 冲 型 边缘 主要 对 应 于 细 条 状 的 灰 度 值 突 变 区 域 。 屋 顶 型 
的 边缘 上 升 沿 和 下 降 沿 都 比较 缓慢 。 脉 冲 型 边缘 和 屋顶 型 边缘 的 特点 是 一 阶 导 数 在 边缘 处 出 
现 零 交叉 ， 二 阶 导 数 在 边缘 处 出 现 极 值 。 这 些 都 是 理想 情况 ， 实 际 中 的 图 像 往往 会 登 加 各 种 
噪声 ， 图 像 边缘 总 有 一 些 模糊 ， 灰 度 变 化 曲线 都 有 一 定 的 坡度 。 

边缘 检测 包含 两 个 方面 含义 : 

1) 检测 边缘 点 或 边缘 线段 。 

2) 将 边缘 点 或 边缘 线段 连接 组 合成 边缘 ， 最 好 是 单 像素 边缘 。 


4.3.1 边缘 点 检测 


边缘 检测 的 算法 很 多 ， 说 明 如 下 。 

(1) 空域 微分 算 子 法 

这 也 是 传统 的 边缘 检测 算法 。 由 于 边缘 是 图 像 上 灰 度 变换 最 为 剧烈 的 地 方 ， 因 此 函数 梯 
度 变化 大 的 地 方 就 是 边缘 。 传 统 的 边缘 检测 算 子 正 是 利用 这 个 特点 ， 对 图 像 中 的 各 个 像素 求 
一 阶 或 二 阶 导 数 来 确定 图 像 的 边缘 点 。 其 中 ， 一 阶 微分 图 像 的 峰值 点 对 应 着 图 像 的 边缘 ， 二 
阶 图 像 的 过 零点 对 应 着 图 像 的 边缘 点 。 目 前 ， 已 经 提出 了 各 种 各 样 的 空域 微分 算 子 ， 例 如 
Robert 算 子 、Sobel 算 子 、 拉 普 拉 斯 算 子 等 典型 的 梯度 算 子 。 

(2) 曲面 拟 合法 

利用 当前 像素 邻 域 中 的 一 些 像素 拟 合 一 个 曲面 ， 然 后 求 这 个 连续 曲面 在 当前 像素 处 的 梯 
度 。 

(3) 小 波多 尺度 检测 
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利用 多 种 尺度 的 边缘 检测 算 子 对 图 像 进行 检测 ， 然 后 综合 它们 的 检测 结果 以 获得 理想 的 
输出 。 通 常 ， 小 尺度 参数 的 检测 算 子 能 够 检测 出 灰 度 的 细微 变换 ， 反 映 更 多 的 边缘 细节 ， 定 
位 精度 较 高 ， 但 对 噪声 比较 敏感 。 而 大 尺度 参数 的 检测 算 子 能 够 检测 出 灰 度 的 粗 变换 ， 反 映 
大 的 边缘 轮廓 ， 对 噪声 不 敏感 ， 但 是 定位 精度 较 差 。 因 此 ， 在 多 尺度 边缘 检测 中 ， 充 分 发 挥 
大 、 小 尺度 各 自 的 优势 ， 对 各 种 尺度 上 的 边缘 图 像 进行 综合 ， 就 可 以 得 到 精确 的 图 像 边 缘 。 

(4) 基于 数学 形态 学 的 边缘 检测 

数学 形态 学 是 一 种 有 代表 性 的 非 结 构 数 学 方法 。 数 学 形态 学 运算 中 物体 形状 集合 与 结构 
元 素 之 间 的 相互 作用 ， 对 边缘 方向 不 敏感 ， 并 能 在 很 大 程度 上 抑制 噪声 和 探测 真正 的 边缘 。 
目前 ， 常 见 的 基于 数学 形态 学 的 边缘 检测 方法 有 ， 基 于 多 尺度 形态 学 的 边缘 检测 、 基 于 数学 
形态 学 多 级 平均 的 图 像 边缘 检测 、 基 于 偏 微分 方程 的 形态 学 边缘 检测 、 基 于 均衡 化 和 数学 形 
态 学 的 组 合 边缘 检测 等 。 其 中 ， 空 域 微分 算 子 法 、 曲 面 拟 合法 等 属于 经 典 的 边缘 检测 算法 。 

基于 多 尺度 的 边缘 检测 与 基于 形态 学 的 边缘 检测 则 是 近 20 年 来 迅速 发 展 起 来 的 新 方法 。 
下 面 主要 介绍 梯度 算 子 法 和 曲面 拟 合法 等 经 典 的 边缘 检测 算法 和 基于 形态 学 和 小 波 的 边缘 检 
测 方法 。 

1. 梯度 算 子 

灰 度 不 连续 常 可 利用 导数 检测 ， 一 般 常 用 一 阶 和 二 阶 导数 来 检测 边缘 点 。 利 用 导数 微分 
性 质 检测 图 像 中 的 突变 ， 主 要 关注 图 像 中 的 恒定 灰 度 区 、 突 变 的 开头 和 结尾 及 沿 灰 度 级 斜坡 
的 导数 特征 。 这 些 数据 类 型 的 微分 性 质 可 以 用 来 描述 图 像 中 的 噪声 点 、 边 缘 等 特征 。 在 边缘 
检测 中 ， 基 于 一 阶 和 二 阶 微分 定义 的 边缘 检测 方法 要 保证 在 灰 度 不 变 区 域 的 微分 值 为 零 、 在 
灰 度 阶梯 或 斜坡 的 起 始点 处 微分 值 非 零 和 治 和 斜坡 面 的 微分 值 非 零 。 

(1) 数字 图 像 微分 定义 

在 数字 图 像 处 理 中 ， 一 元 函数 表达 的 一 阶 微分 的 定义 如 下 : 


2 = fx +1) -fx) (4.6) 


这 里 为 了 与 二 元 图 像 函 数 /(x,y) 求 微分 时 的 表达 式 一 臻 ,使 用 偏 导 数 符号 。 对 二 元 函数 ， 
将 沿 着 两 个 空间 轴 人 处 理 偏 微分 。 二 元 函数 的 二 阶 微分 定义 为 


oF = fr +1) -fx) - As) -fx -1)) =/(x +1) +f(x-1) -2/(x) (4.7) 


(2) 梯度 算 子 的 计算 
梯度 算 子 即 基于 一 阶 微分 的 图 像 边缘 检测 方法 。 图 像 处 理 中 基于 一 阶 微分 的 边缘 检测 是 








通过 梯度 法 实现 的 。 对 于 图 像 函数 . Kx,y) ， 在 其 坐标 (x*，y) 上 的 梯度 可 表示 为 一 个 矢量 ， 
通过 二 维 列 矢量 来 定义 ， 其 中 G,，6, 分 别 为 沿 « 方 向 和 ;方向 的 导数 ， 即 
vn -rc G1 = [YL 4] (4.8) 


由 矢量 分 析 可 知 ， 梯 度 矢量 指向 坐标 (x,y) 的 f(x,y) 的 最 大 变化 率 方向 。 在 边缘 检测 中 ， 
梯度 矢量 的 大 小 用 矢量 模 Vf 表 示 ，Vf 给 出 了 在 Vf(x,y) 方向 上 每 增加 单位 距离 后 f(x,y) 
值 增 大 的 最 大 变化 率 。 一 般 来 讲 ， 也 将 Vf 称 为 梯度 。 Vf(x,y) 和 Vf 交替 使 用 梯度 这 一 术 
语 , 但 具体 应 用 时 应 注意 是 指 梯度 矢量 还 是 指 梯度 矢量 的 大 小 。 

梯度 矢量 方向 用 方向 角 表 示 。 令 a(%,y) 表示 矢量 Vf 在 (x,，y) 人 处 的 方向 角 。 梯 度 矢量 
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的 幅 值 和 方向 角 分 别 为 
Vf/ = mag( V/) = (G+ G6) 
Qa(x,y) = arctan( G,/G.,) 
这 里 角度 以 x 轴 为 基准 度量 。 边 缘 在 (*，7y) 处 的 方向 与 该 点 的 梯度 矢量 的 方向 垂直 。 式 
(4.9) 幅 度 计算 对 应 欧 氏 距离 ， 也 可 对 应 其 他 距离 来 计算 幅度 ， 例 如 
1) 幅度 计算 对 应 城区 距离 为 


(4.9) 




















-19f of 
Vf = 十 ay (4.10) 
2) 幅度 计算 对 应 棋盘 距离 为 
生 of 0f 
Vv/ = max| | (4.11) 














虽然 梯度 矢量 的 分 量 是 线性 算 子 ， 但 由 于 梯度 模 值 用 到 了 二 次 方 和 开 方 运算 ， 因 此 梯度 
矢量 的 模 值 不 是 线性 的 。 梯 度 矢 量 中 的 偏 导数 不 是 各 向 同性 的 ， 但 梯度 矢量 的 模 值 是 各 向 同 
性 的 。 对 应 城区 距离 的 梯度 计算 简单 且 保 持 了 灰 度 的 相对 变化 ,但 各 向 同性 特性 较 差 ， 对 水 
平和 垂直 边缘 给 出 了 相同 的 结果 。 

(3) 梯度 算 子 的 计算 模板 

1) 梯度 模板 ”计算 图 像 梯度 是 基于 对 在 每 个 像素 位 置 计算 偏 导数 9f/9x , 9f/90y 。 图 
4. 12 所 示 模 板 表示 图 像 3 x3 区 域 的 图 像 点 。 例 如 硅 中 心 点 zs 表示 f(x,y) ， 那么 zi 代表 f(x 
-1,y -1) ， 以 此 类 推 。 那 么 采用 上 述 模 板 计算 一 阶 导 数 可 表示 为 G, =zs -zs，G, =2z6 -zso 

2) Robert 交叉 梯度 算 子 ”根据 上 述 图 像 中 导数 计算 的 定义 ， 导 数 计算 可 以 采用 交叉 差 
分 算法 操作 ， 即 








G,=20 -2s, CG, =Z8 一 36 (4. 12 ) 
上 述 计算 即 为 Robert 交叉 梯度 算 子 导数 计算 方法 ， 可 采用 2 x2 尺度 的 模板 ( 见 图 4. 13 ) 实现 
上 述 操作 。 
































图 4.12 计算 模板 图 4. 13 Robert 交叉 算 子 
如 果 选 取 幅 度 ， 可 以 按 下 式 计 算 梯 度 ， 即 
Th | 二 过 9 (4. 13) 
如 果 使 用 绝对 值 ， 按 下 式 计 算 梯 度 . 
Vf =| z, -2z1+lz — zl| (4.14) 





3) Prittew 算 子 ”偶数 模板 不 好 用 ，2 x2 的 模板 没有 明确 的 中 心 点 。 习 惯 上 定义 尺寸 为 

3 x3 的 最 小 模板 ， 使 用 下 式 计算 zs 点 的 导数 : 
G, = (2 +2 +20) — (zi +2, +23) (4. 15 ) 
C = (2 +26 +2) — (Zz +24 +27) (4. 16) 
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3 x3 大 小 区 域 中 的 第 一 行 和 第 三 行 间 的 差 近 似 于 x 方向 的 导数 ， 第 三 列 和 第 一 列 之 差 
近似 于 y 方 向 上 的 导数 。 上 述 计算 即 为 Prewitt 算 子 导数 计算 方法 。Prewitt 算 子 导数 计算 可 
采用 图 4. 14 所 示 的 两 个 模板 。 

可 以 按 如 下 梯度 模 值 和 绝对 值 形式 计算 梯度 ，; 


Vf=[(z +2 +2 -2 -2 2) + (2 +2 +2 2 2 1)2]3 (4.17) 
Vf~|z +z +2 -2 -2 21 +lz +z +2 -2 -2 -Z| (4. 18 ) 

4) Sobel 算 子 “改进 上 述 Prewitt 算 子 计算 公式 ， 在 中 心 系数 上 使 用 一 个 权 值 2 得 到 
G, = (2 +2ze +20) — (2 + 2z, +23) (4. 19 ) 
C = (zs +2z6 +20) — (2 +2z +27) (4. 20) 


在 3 x3 图 像 区 域 中 ,第 三 行 与 第 一 行 间 的 差 接 近 于 % 方向 的 微分 ， 第 三 列 和 第 一 列 之 
差 近 似 于 y 方 向 上 的 导数 。 使 用 权 值 2 的 目的 是 通过 突出 中 心 点 的 作用 而 达到 平滑 的 目的 。 
上 述 计算 方法 即 为 Sobel 算 子 导数 的 计算 方法 ，Sobel 算 子 导数 计算 可 采用 图 4. 15 所 示 的 模 
板 。 







































































图 4. 14 Prewitt 算 子 导数 计算 可 采用 的 模板 图 4.15” Sobel 算 子 导数 计算 用 的 模板 
如 果 选 取 幅 度 ， 可 以 按 如 下 梯度 模 值 和 绝对 值 形 式 计 算 梯度 : 


Vf = [(z, +2zs +2z) -Zs 一 2z = ) + (2 +2z + Zs — 2 -22 -x )]? (4.21) 
Vf =| (2 +2ze +20) — (2 +2z, +23) 1 +| (zs +2z6 +20) - (2 +2z4 +2) 1 











(4. 22) 
5) 梯度 算 子 ”对 G,，G, 各 用 一 个 模板 ， 所 以 需 两 个 模板 组 合 起 来 构成 一 个 梯度 算 子 。 
常用 的 梯度 算 子 有 Robert 算 子 、Sobel 算 子 、Prewitt 算 子 。 各 算 子 模板 分 别 如 图 4. 13 、 图 

4. 14、 图 4.15 所 示 。 所 有 模板 的 系数 和 为 零 ， 表 明 在 灰 度 恒定 区 的 响应 为 零 。 

(4) 拉 普 拉 斯 算 子 
拉 普 拉 斯 算 子 是 二 元 函数 的 二 阶 微分 在 图 像 边 缘 检 测 中 的 应 用 ， 是 二 阶 微分 算 子 。 一 
二 元 图 像 函 数 f(x,y) 的 拉 普 拉 斯 变换 定义 为 
Vr-Arayi ay (4. 23) 
Ox oy 


拉 普 拉 斯 变换 是 线性 操作 。 为 适合 图 像 处 理 ， 将 方程 表示 为 离散 形式 。 通 过 邻 域 处 理 定义 离 
散 变换 ， 根 据 二 阶 微分 定义 ， 在 * 方向 上 二 阶 偏 微分 采用 下 式 定义 ， 

OF = fs ty) +fls 17) -frsy) (4.24) 
类 似 地 ， 在 y 方向 上 有 





















































3 fy + +f/(x,y -1) -2/(x,y) (4.25) 
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则 拉 普 拉 斯 算 子 的 数字 实现 可 由 这 两 个 分 量 相 加 得 到 


Af = Et Het) tf -1 tsy +1) + fesy -TD) -4 





上 述 公 式 可 用 图 4. 16a 所 示 模 板 实现 。 
如 图 4. 16b 所 示 ， 对 角 线 方向 也 可 以 加 入 
到 离散 拉 普 拉 斯 变换 定义 中 ， 即 在 定义 式 
中 添 入 两 项 ， 两 个 对 角 线 方向 各 加 入 一 项 。 
由 于 每 个 对 角 线 方向 上 的 项 还 包含 一 个 
- 21x,y) ， 所 以 从 不 同方 向 项 上 减 去 的 总 
和 是 - 8f(x,y) 。 图 4.16c 所 示 的 另 两 个 模 
板 实际 中 也 经 常 使 用 。 这 两 个 模板 以 拉 普 
拉 斯 变换 定义 为 基础 ,其 中 的 系数 与 图 
4. 16a 符号 相反 。 上 述 模板 的 基本 要 求 是 对 
应 中 心 像素 的 系数 是 正 的 ， 邻 近 像素 的 系 
数 是 负 的 ， 且 所 有 系数 的 和 是 零 ， 这 样 在 
灰 度 平坦 区 域 响应 为 零 。 

拉 普 拉 斯 算 子 比 前 文 所 述 的 计算 多 个 
方向 导数 的 梯度 算 子 的 计算 量 小 。 只 需 一 
个 计算 模板 且 不 必 毕 合 各 模板 的 值 。 




























































































1) 拉 普 拉 斯 算 子 特点 ” 拉 普 拉 斯 算 子 是 








(4. 26) 
0 1 0 
1 -4 1 
0 1 0 
a) 离散 拉 普 拉 斯 变换 b) 用 于 执行 该 公式 的 
边缘 检测 模板 扩展 模板 
0 -1 0 
-1 4 -1 
0 -1 0 




















c) 其 他 两 种 拉 普 拉 斯 变换 模板 











图 4.16 拉 普 拉 斯 变换 模板 





种 各 向 同性 的 无 方向 性 滤波 咒 。 这 种 滤波 器 


的 响应 与 图 像 的 突变 方向 无 关 ， 各 向 同性 (无 方向 性 ) 滤波 器 是 旋转 不 变 的 ， 即 将 原始 网 像 
旋转 后 进行 滤波 处 理 的 结果 与 先 对 图 像 滤波 ， 然 后 再 旋转 的 结果 相同 。 图 4. 16a 、b 所 示 模 
板 对 90°* 和 45° 的 角度 旋转 是 各 向 同性 的 。 作 为 一 个 二 阶 导数 ， 拉 普 拉 斯 算 子 对 噪声 比较 敏 





感 ， 对 图 像 计算 后 会 增强 噪声 ， 因 此 拉 普 拉 














的 幅 值 产生 双边 缘 。 拉 普 拉 斯 算 子 不 能 检测 边缘 方向 。 由 于 上 述 原因 ， 拉 普 拉 斯 算 子 在 分 害 





























斯 算 子 一 般 不 直接 用 于 边缘 检测 。 拉 普 拉 斯 算 子 
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一 





中 常 与 平滑 滤波 器 组 合 使 用 ， 利 用 其 零 交 义 的 性 质 进 行 边 缘 定 位 ， 也 用 来 确定 一 个 像素 是 在 


边缘 暗 的 一 边 还 是 亮 的 一 边 。 











2) 拉 普 拉 斯 算 子 与 平滑 滤波 组 合 使 用 考虑 函数 





h(x,y) = -eo 








(4. 27) 


式 中 ，o 为 标准 差 。 根 据 高 斯 滤波 融 特 点 ， 用 一 幅 图 像 与 该 函数 卷 积 会 模糊 该 图 像 ， 图 像 的 
模糊 程度 是 由 o 值 决 定 。h 函数 的 拉 普 拉 斯 算 子 ， 即 疡 关于 x*，y 的 二 阶 导 数 ， 即 高 斯 函数 





























的 拉 普 拉 斯 算 子 





Ah(r) =- [一 一] 党 

















(4. 28) 














式 中 ,= +y。 式 (4.28) 叫 做 高 斯 型 拉 普 拉 








斯 算 子 (LoG) 。 图 4. 17 所 示 为 LoG 函数 的 三 





维 曲线 、 图 像 、LoG 函数 的 横 截 面 和 对 Ah 近似 的 5 x5 模板 。 模 板 系数 总 和 为 零 。 





























根据 地 





数 形 状 ， 高 斯 型 的 拉 普 拉 斯 算 子 有 时 也 被 称 为 墨西哥 草帽 函数 。 因 为 二 阶 导数 是 线性 运算 ， 
所 以 用 Ah 卷 积 一 幅 图 像 与 首先 使 用 高 斯 型 平滑 也 数 卷 积 该 图 像 ， 然 后 计算 卷 积 结果 的 拉 普 
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拉 斯 算 子 效果 相同 。 因 此 采用 高 斯 型 拉 普 拉 斯 算 子 卷 积 图 像 ， 相 当 于 使 用 高 斯 型 函数 对 图 像 
进行 平滑 处 理 后， 对 图 像 采用 拉 普 拉 斯 算 子 检测 图 像 边 缘 。 

































































9 高 斯 函数 的 三 维 曲线 b) 图 像 表示 的 高 斯 函数 
本 (黑色 是 负 值 区 域 ， 灰 色 是 
零 值 区 域 ， 白 色 是 正 值 区 域 

0 | 0 1|1010 

















rr 




















| | 0 |-1|1=-2|1-=-1|10 
| | 
| 0l|0|-1lolo 
-i [on 
c) 零 交 叉 横 截面 显示 d) 与 a 近似 的 5 xX5 模 板 























图 4.17 高 斯 型 拉 普 拉 斯 算 子 (LoG) 











(5) 方向 算 子 

方向 算 子 利用 一 组 模板 分 别 计算 在 不 同方 向 上 的 差分 值 ， 取 其 中 最 大 的 值 作为 边缘 强 
度 ， 而 将 与 之 对 应 的 方向 作为 边缘 方向 。 

1) Kirsch(3 x3) 模 板 


















































图 4.18 ” Kirsch 算 子 的 八方 向 3 x3 模板 





2) Nevitia(5 x5) 模 板 

2. 曲线 (曲面 ) 拟 合 

曲线 (曲面 ) 拟 合 就 是 用 某 个 解析 函数 通 近 实际 数据 。 其 基本 思想 是 ， 用 一 个 平面 或 曲 
面 去 通 近 一 个 图 像 面积 元 ， 然 后 用 这 个 平面 的 梯度 或 曲面 的 梯度 蔡 代 点 的 梯度 ， 从 而 实现 边 
缘 检 测 。 可 见 ， 曲 面 或 曲线 的 函数 表达 式 的 确定 及 图 像 面积 元 的 选择 均 是 曲线 (曲面 ) 拟 合 
的 关键 。 常 用 的 面积 元 有 图 4. 20 所 示 的 4 点 面积 元 和 9 点 面积 元 两 种 。 
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图 4. 19 ”Nevitia 算 子 的 十 二 方向 5 x5 模板 















































fl,y1) | fl) | ftl,y-1) 
f(x,») fx+1,y) f(x-1,y) f(x,») f(x+1,y) 
Je ptl) | fxtl,y+1) fl p+1) | Ff, ptl) | fCtl,y+1) 
a) 4 点 面积 元 b) 9 点 面积 元 


图 4.20 ”曲面 (曲线 ) 拟 合 中 常用 的 两 种 面积 元 
常用 的 曲面 表达 是 一 次 平面 拟 合 和 二 次 曲面 拟 合 两 种 表达 式 。 
(1) 一 次 曲面 拟 合 
次 平面 拟 合 就 是 用 函数 的 一 次 表达 形式 拟 合 一 个 图 像 面 积 元 f(x,y) ， 即 
g(x,y) = ax+by+ce (4. 29) 
如 果 图 像 面积 元 由 图 4. 20a 所 示 的 4 个 像素 组 成 ,那么 f(x,y) 和 g(x,y) 之 间 的 方 均 误 
差 为 
se= 之 [g(x,y) -fx7)] = [or tby+e—-f(x,y)"] + Lax+b(y+1) +e—f(%, 





(x,y) eAs 
y+1)]’ +[a(x+1) +by+c-flx+1,y)]” 十 
[a(x +1) +pb7+1) +ec-f/flx+1l,y+1)]’ (4. 30) 





目标 是 寻找 最 佳 的 参数 a、b 和 c， 从 而 使 g(x,y) 与 f(x,y) 之 间 的 方 均 误 差 e 最 小 。 为 
此 需要 对 式 (4. 30) 中 的 a、5b 和 < 分别 进行 求 导 并 令 导 数 为 0， 最 后 通过 联 立 三 个 方程 来 求 
解 a、b 和 三 个 参数 。 首 先 ， 对 式 (4. 30) 进 行 求 导 ， 可 以 得 到 如 下 三 个 表达 式 : 





5 = 2x[ar + by te -f(x,y)] +2x[ax +b(y+1) +ec—-f(x,y+1)] +2(x+ 
1)[a(x+1) +by+c—-f(x+1,y)] +2(x +1)la(x+1) +b(y+1)+ 
c-f(x+1l,y+1)] =0 (4.31) 

2 = 2y[ax + by te -f(x,y)] +2(y+1)[ax +b(y+1)+c-f(x,y+1)]+ 


2y[a(x +1) +by+cec-f(x+1,y)] +2(y +1)[a(x +1) +b(y+1)+ 
c-f/(x+1,y+1)] =0 (4. 32) 














2 =2[aox+pbr+c-Ax,y)]+2[axz+pr+1l)+c-Axy+l)] + 
2[a(x+1) +by+c-f(x+1,y)] +2[a(x +1) +b(y+1)+ 
c-f/(x+1,y+1)] =0 (4. 33) 
联 立 式 (4.31) ~ 式 (4.33)， 可 以 计算 出 c、 和 < 的 解 为 
fx, y+1) +f(x+1, y+1) flx, y) +f/(x+1, y) 
a= 7 一 7 (4. 34) 
/x+l, y) +f(x+1, y+1) flx, y) +f(x, y+1) 
b= 本 三 本 (4. 35) 
,37x， y) +f(x, y+1) +f/(x+1, y) -f(x+1, y+1) -xa-yb (4. 36) 
4 . 


从 式 (4.34) 和 式 (4.35) 可 以 看 出 ，a 是 两 行 像素 平均 值 的 差分 ，! 是 两 列 像素 平均 值 的 
差分 。 所 以 这 种 方法 对 噪声 不 敏感 。 根 据 梯 度 的 定义 ,平面 ax + by +c 上 的 梯度 幅度 为 





8 (%) = (4. 37) 
g(y) = (4. 38) 
Glg(x,y)] = Ve (x) +g(y) = Va +b’ (4. 39) 
或 
Gle(x,y)] =l al +l 61 (4. 40) 
Glg(x,y)] = max(l| al ,1 51) (4.41) 





由 于 这 个 平面 是 对 已 知 的 2 x2 平面 的 最 好 近似 ， 故 可 以 把 该 平面 的 梯度 看 作 是 该 邻 域 
中 心 处 [+ 闻 ,7+ 方 ) 加 像 榜 度 的 近似 值 。 

如 果 图 像 元 面积 元 由 图 4. 20b 所 示 的 9 个 相 邻 像素 组 成 ， 则 /Lx,y) 和 g(x,y) 之 间 的 方 
均 误差 为 

a= > [g(x,y) -f(x,y)] = [al(x -1) +oy -1) te-flx-1,y-1)]’ + 


(Cw A 
[ax+b(y—-1) +c-flx,y -1)] +[a(x+1) +b(y—-1)+c-— 
flx+1,y-1)] +[a(x—-1) +by+c—-f(x—1,y)] +[ax+by+ 
cflx,y)] + lalx+1) +oby+ec-fx+1,y)] +ia(x—-1)+ 
bl(y+1) +cec-flx-1,y+1)] +[ax+b(y+1) +c-flx,y +1)] + 
[a(x+1) +b(y+1) +c-fl(x+1,y+1)] (4.42) 
将 式 (4.42) 对 a、 和 进行 求 导 并 邻 导数 为 0， 即 
9 _ 
oa 
9e _ 
ob 
ae _ 
gc 
求解 式 (4.43)， 就 可 以 得 到 a、b 和 e 的 解 为 
_ f/x-1,y+1) 二 +f(x+1,y+1) 


0 (4. 43) 
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Hs-1y -D+fs 1 +fs -1,y+)) (4.44) 








) A+1, y—1) tA y) +f(x+1l, y+1) 





f(x-1, y-1) tA y) +f/(x—-1, y+1) (4.45) 





之 fx +i,y +]) -9ax — 9by 
“7 9 
然后 将 a、5 的 值 代入 式 (4.37) ~ 式 (4.41) 计 算 位 置 [x，y] 的 梯度 值 。 
(2) 二 次 曲面 拟 合 
设 检 测 像素 所 在 的 面积 元 为 图 4. 20a 所 示 ， 用 二 次 曲面 
g(x, y) =ax +bxy+cy +dx +ey+k (4.47) 
去 拟 合 f(%x,y) ， 并 产生 方 均 误差 
as= > [g(x,y) -fxs7)] = [ai + bry toy + dr+ey +hk -f(x,y)] + 


(x,)) As 
[a(x +1)* +b(x+1)y+cey +d(x+1) +ey+k-f(x+1,y)] + 
[ax + bx(y +1) +c(y +1) + dx +e(y+1) +k-flx,y+1)] + 
[ce 人 (x+1) +b(x+1)(y+1) +c(y+1)* +d(x+1) +e(y+1) + 天 一 
xz+ly+1l)]” (4. 48 ) 
将 式 (4.48) 对 a、b、c、d、e 和 六 个 参数 分 别 进行 求 导 并 令 导 数 为 0， 最 后 联 立 式 
(4.49) 所 示 的 6 个 方程 组 成 的 方程 组 ， 就 可 以 推导 出 a、b5、c、d、e 和 上 的 表达 式 ， 有 


(4.46) 





0 上 _ 08 _ 08 _ 08 _ 08 _ O08 _ 














oa ”% 本 Oc 0, od 0 Oe ” ok 由 en， 

这 里 推导 过 程 从 略 。 在 分 别 求 出 六 个 参数 后 ， 计 算 曲 面 在 [x，y] 的 梯度 为 
g(x%) =2ax+by+d (4. 50 ) 
g(y) =2cy +bx+e (4.51) 


然后 将 梯度 带 入 式 (4. 37) ~ 式 (4. 41) 计 算 其 梯度 幅度 。 

3. 结合 特定 理论 工具 的 图 像 边缘 检测 

(1) 基于 数学 形态 学 的 边缘 检测 

对 某 些 强 噪 声 图 像 ， 数 学 形态 学 运算 可 能 取得 好 的 效果 。 常 用 的 边缘 检测 算 子 通过 计算 
图 像 中 局 部 小 区 域 的 差分 来 工作 。 这 类 边缘 检测 器 或 算 子 都 对 噪声 比较 敏感 ， 并 且 常 会 在 检 
测 边缘 的 同时 加 强 噪声 。 

数学 形态 学 边缘 检测 主要 用 到 形态 梯度 的 概念 ， 虽 也 会 对 噪声 比较 敏感 但 不 会 放大 噪声 。 

设 4 表示 图 像 ，B 表示 结构 元 素 ， 旬 表示 膨胀 运算 ，8 表示 腐蚀 运算 。 则 基本 的 形态 梯 
度 如 下 : 








Grad = (4®B)-A4 (4. 52) 
Grad, = A - (AQB) (4. 53) 
Grad = (A ®B) - (488) (4. 54) 


1) 二 值 图 像 边 缘 提 取 ”对 于 二 值 图 像 ， 膨 胀 运算 使 图 像 扩展 ， 腐 蚀 运算 使 图 像 收缩 ， 
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则 上 述 边 缘 检 测算 子 可 以 检测 二 值 图 像 的 边缘 。 图 4.21 所 示 为 Grad; 示例 。 其 中 图 4. 21a 为 
图 像 4， 图 4.21b 为 结构 元 素 B, 图 4.21c 为 4 四 B,， 图 4.21d 为 49B8， 图 4.21le 为 Grad;。 
即 4@B 将 图 像 区 域 扩展 了 B/2 个 像素 宽度 ，48B 将 图 像 区 域 收缩 了 B/2 个 像素 宽度 。 这 样 
两 幅 图 像 的 差 ， 将 边缘 保留 下 来 ，Grad; 给 出 的 像素 有 B 像素 的 宽度 。 
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a) 图 像 A b) 








si 


结构 元 素 B cAGB 



















































































d) AOB 


图 4.21 Grads 示例 


€) Grad; 


较 细 的 边界 可 用 Grad, 、Grad, 检测 。 图 4. 22 所 示 为 Grad; 、Grad, 不 例 ， 边 缘 检测 原理 与 
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图 4.22 Grad, 、Grad, 示例 
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上 述 Grad; 相同 ，Grad 、Grad, 所 给 出 的 边界 都 为 B/2 个 像素 的 宽度 。Grad, 、Grad, 、Grad; 都 
没有 放大 噪声 。 采 用 Grad, 和 3 x3 结构 元 素 进行 的 二 值 图 像 边缘 提取 如 图 4.23 所 示 。 

2) 灰 度 图 像 边缘 提取 对 于 灰 度 一 一 - 
图 像 ， 当 采用 一 定 的 结构 元 素 对 图 像 
进行 膨胀 运算 时 ， 图 像 边缘 向 着 低 灰 
度 区 扩展 ; 当 对 图 像 进行 腐蚀 运算 时 ， 
图 像 边缘 向 着 高 灰 度 去 收缩 。 因 此 ， 
采用 上 述 形态 梯度 算 子 时 ， 可 以 检测 
图 像 的 边缘 。 检 测 到 的 边缘 宽度 与 结 
构 元 素 的 尺度 有 关 ， 设 结构 元 素 为 B， 
Grad, 、Grad, 为 B/2 宽度 边缘 ，Grad， 
为 B 宽度 边缘 。 图 4. 24 详细 地 给 出 了 
形态 梯度 算 子 检测 边缘 时 检测 的 边缘 
形态 和 结构 元 素 尺 度 之 间 的 关系 。 

灰 度 图 像 形态 梯度 算 子 形式 与 二 J@4 J@B 
值 图 像 形态 梯度 算 子 相同 。 po 














图 4.23 采用 Grad, 和 3 x3 结构 元 素 
进行 的 二 值 图 像 边缘 提取 








(2) 基于 小 波 变换 的 边缘 检测 2 
设 0(1) 是 某 一 起 平滑 作用 的 低 通 MX 
平滑 函数 ， 且 满足 条 件 
Be /EAB /88 7164 


[ 00d = 1, lim 0(1) =0 
(4. 55) 
为 了 方便 起 见 ， 不 妨 取 0(1) 为 高 斯 也 
数 ， 即 


























人 图 4 24 形态 梯度 算 子 检测 边缘 的 形态 
| 与 结构 元 素 尺度 的 关系 
假设 9(1) 是 二 次 可 导 的 ， 并 且 定 义 y(1) ,wy 中 (1) 分 别 是 9(1) 的 一 阶 和 二 阶 导数 ， 即 
pO) = MP) = 于 的 (4.57) 
则 函数 yy 中 (4) ,yy 了 (4) 满足 小 波 函数 的 可 容许 性 条 件 
[ WY (td = o,f WY (tdit=0 (4. 58) 


因此 ,ym (2) ,w(t) 可 用 作 小 波 母 函数 。 
由 于 二 进 小 波 变换 就 是 通过 将 原 信号 (4) 同 伸缩 小 波 卷 积 得 到 的 ， 以 办” (i) 为 小 波 函 
数 ， 函 数 了 (zs) 在 尺度 为 a， 位 置 为 ;处 的 卷 积 型 小 波 变 换 定义 为 


WA) = fu (0) = 去 | A (HT)ar (4. 59) 
对 应 于 y(t) 的 小 波 变 换 为 
WE) = xy2(D = 二 | Ar (EL)ar (4.60) 
一 oo Qa 


0(t) = 
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由 微分 是 线性 变换 和 y(t) 和 yw (5 的 定义 可 得 


WO =f* (a de) = a 0.) (0) 


(4.61) 





2 一 f* ,dd 0。 _ 2 dd 水 
WOft) =f (« -0 = 0) (0) 


由 于 f* 9,(i) 是 由 低 通 平滑 函数 0(1) 在 尺度 a 下 对 函数 f(i) 进行 平滑 的 结果 。 由 式 (4. 61) 
和 式 (4. 62) 可见， 小 波 变 换 WDA(t) 、WW2ft) 分 别 是 函数 f(t) 在 尺度 a 下 由 9(1) 平滑 后 
再 取 一 阶 与 二 阶 导数 。 

若 取 0(t) 为 三 阶 样 条 函数 ， 如 图 4. 25 所 示 为 y(t) 和 w(t) 的 波形 。 图 4. 26 所 示 
为 函数 f(t) 及 其 在 小 波 基 w(t) 和 水 2 (下 的 二 进 卷 积 型 小 波 变 换 。 可 见 ; 


(4. 62) 
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图 4.25 yw?(t) 和 ww(1) 的 波形 





1) 1 Wf/(t) 1 的 局 部 模 极 值 点 (i, 4， 
已) ， 既 对 应 于 1 WY(1) | 的 过 零点 ， 又 对 应 
于 平滑 后 信号 f* 9,(t) 的 拐点 。 当 a 很 小 时 ,用 /0 
9(t) 对 f(t) 平滑 的 结果 对 f(z) 的 突变 部 分 的 位 
置 与 形态 影响 不 大 。 而 当 a 较 大 时 ， 则 此 平滑 过 
程 会 将 f(1) 的 一 些 细小 突变 部 分 消去 ， 而 只 剩 下 
大 尺寸 的 突变 。 

2) 当 小 波 函 数 可 看 作 某 一 平滑 函数 的 一 阶 
导数 时 ， 信 号 小 波 变 换 模 的 局 部 极 值 点 对 应 于 信 
号 的 突变 点 (或 边缘 ) 。 当 小 波 函 数 可 看 作 某 一 平 
滑 函 数 的 二 阶 导 数 时 ， 信 号 小 波 变换 模 的 过 零 
点 ， 也 对 应 于 信和 号 的 突变 点 (或 边缘 ) 。 

综 上 所 述 ， 以 平滑 函数 的 一 阶 导数 yy (4) 
为 母 小 波 作 小 波 变换 时 ， 其 小 波 变换 在 各 尺度 下 
系数 的 模 的 极 大 值 对 应 信号 的 突变 点 位 置 。 


d 到 
WEY (六 9) 
尺度 a 越 小 , 9,(t) 平滑 区 域 小 ， 小 波 系数 = 
模 极 大 值 点 与 突变 点 位 置 的 对 应 就 越 准 确 。 但 


是 ， 小 尺度 下 小 波 系数 受 噪 声 影响 大 ， 产 生 许多 图 4. 26 二 进 卷 积 型 小 波 变换 
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伪 极 值 点 。a 大 尺度 下 ， 对 噪声 进行 了 一 定 的 平滑 ， 极 值 点 相对 稳定 。 但 由 于 平滑 作用 使 其 
定位 又 产生 了 偏差 .同时 只 有 在 适当 尺度 下 ， 各 突变 点 引起 的 小 波 变 换 才能 避免 交 半 干扰 。 

因此 ， 用 小 波 变 换 模 极 大 值 法 判断 信号 突变 点 时 ， 需 要 把 多 尺度 结合 起 来 综合 观察 。 只 
赁 一 个 尺度 不 能 定位 突变 点 的 位 置 。 


4. 3. 2 边缘 连接 


边缘 检测 的 功能 是 检测 出 图 像 中 的 边缘 像素 点 。 由 于 噪声 、 不 均匀 光照 及 其 他 原因 引入 
的 干扰 会 产生 边缘 间断 和 伪 边 缘 点 ， 使 得 实际 的 边缘 像素 很 少 能 完整 描述 成 一 条 边缘 。 因 
此 ， 在 边缘 检测 之 后 要 进行 边缘 连接 ， 将 边缘 像素 组 合成 有 意义 的 边缘 。 边 缘 连 接 包 含 两 方 
面 含义 : 

1) 剔除 噪声 点 ， 保 留 真正 的 边缘 点 。 

2) 填补 边缘 空白 点 。 

1. 局 部 处 理 方 法 

边缘 连接 最 简单 的 方法 之 一 是 分 析 图 像 中 每 个 边缘 像素 点 (x，y) 的 邻 域 , 如 3 x3 或 5 
x5 邻 域内 像素 的 特点 。 将 所 有 依据 预定 准则 被 认为 是 相似 的 点 连接 起 来 ， 形 成 由 共同 满足 
这 些 准则 的 像素 组 成 的 一 条 边缘 。 在 这 种 分 析 过 程 中 ， 确 定 边缘 像素 相似 性 的 两 个 主要 性 
质 : 

1) 用 于 生成 边缘 像素 的 梯度 算 子 的 响应 强度 ， 有 

| Af(x,y) - Af(xo,y0) IE (4.63) 
则 处 于 定义 的 (*，7y) 邻 域内 坐标 为 (x,，yo ) 的 边缘 像素 ， 在 幅度 上 相似 于 位 于 (*，y) 的 像 
素 ， 这 里 五 是 一 个 非 负 门 限 。 
2) 梯度 矢量 的 方向 (角度 ) 由 梯度 矢量 的 方向 角 给 出 ， 如 果 
| a(x,y) -a(xo,yo) 1 和 4 (4. 64 ) 
则 处 于 定义 的 (x，y) 邻 域内 坐标 为 (x。，yo ) 的 边缘 像素 具有 与 (x，y ) 的 像素 相似 的 角度 。 
这 里 4 是 非 负 门限 。 如 前 所 述 (*，y) 处 边缘 的 方向 垂直 于 此 点 处 梯度 矢量 的 方向 。 

如 果 大 小 和 方向 准则 得 到 满足 ， 则 在 (x，y) 邻 域 中 的 点 就 与 位 于 (x，y) 的 像素 连接 起 
来 。 在 图 像 中 的 每 个 位 置 重复 这 一 操作 。 当 邻 域 的 中 心 从 一 个 像素 转移 到 另 一 个 像素 时 ， 这 
两 个 相连 接点 必须 记录 下 来 。 

2. 边界 跟踪 

边界 跟踪 (Boundary Tracking) 也 称 轮廓 提取 、 轮 廓 跟踪 ， 是 由 梯度 图 中 一 个 边缘 点 出 
发 ， 以 此 搜索 并 连接 相 邻 边缘 点 从 而 逐步 检测 出 边界 的 方法 ， 其 目的 是 区 分 检测 目标 与 背 
景 。 一 般 情 况 下 ， 边 界 跟踪 算法 具有 较 好 的 抗 噪 性 ， 产 生 的 边缘 具有 较 好 的 刚性 。 与 边缘 检 
测 技 术 相 比 ， 图 像 边界 跟踪 技术 只 需要 对 图 像 的 外 部 边缘 进行 跟踪 ， 而 边缘 提取 技术 不 但 需 
要 提取 图 像 的 外 部 边缘 ， 还 需要 提取 图 像 的 内 部 边缘 。 

根据 边缘 的 特点 ， 有 的 边界 取 正 值 ( 例 如 阶 跃 型 边缘 的 一 阶 倒数 为 正 ) 有 的 取 负 值 (例如 
屋顶 形 边缘 的 二 阶 导数 ， 有 的 边界 取 0 值 ( 阶 路 型 边缘 二 阶 导数 ， 屋 顶 形 边缘 一 阶 导数 均 过 
零点 ) ， 因 此 可 以 将 轮廓 提取 算法 分 为 极 大 跟踪 法 、 极 小 跟踪 法 、 极 大 - 极 小 跟踪 法 与 过 零点 
跟踪 法 。 轮 廓 跟踪 过 程 大 致 可 以 分 为 三 步 : 

1) 确定 轮廓 跟踪 的 起 始 边 界 点 。 其 中 起 始 边 界 点 可 以 是 一 个 也 可 以 是 多 个 。 
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2) 确定 和 采取 一 种 合适 的 数据 结构 和 搜索 策略 ， 根 据 已 经 发 现 的 边界 点 确定 下 一 个 检 
测 目标 并 对 其 进行 检测 。 

3) 确定 搜索 终结 的 准则 或 终止 条 件 ( 如 封闭 边界 回 到 起 点 ) ， 并 在 满足 条 件 时 停止 进 
程 ， 结 束 搜索 。 

常用 的 轮廓 跟踪 技术 有 两 种 : 探测 法 和 梯度 图 法 。 假 设 图 像 为 二 值 图 像 且 图 像 边缘 明 
确 ， 图 像 中 只 有 一 个 具有 封闭 边界 的 目标 ， 那 么 探测 法 的 基本 步骤 如 下 : 假设 大 为 记录 图 像 
轮廓 线 像 素 点 数 的 变量 ， 其 初始 值 为 0。 

1) 自 上 而 下 、 自 左 到 右 扫描 图 像 ， 发 现 某 个 像素 m 从 0 变 到 1 时 ， 记 录 其 坐标 (>xo， 
yo), k=0。 

2) 从 像素 (x;，y; -1) 开 始 按 逆 时 针 顺 序 研究 其 8 像素 邻 域 ， 将 第 一 次 出 现 像素 值 为 1 
的 像素 记 为 p,;,， 并 存储 其 坐标 (x,，y,) ， 置 上 =k +1。 像素 (x,，y,) 的 逆 时 针 8- 邻 域 依次 为 
(xasyr — 1) xs 1,yr — 1) (Cx — 1,y) xi oly + 1) xsys t+ 1) CC 二 + 1) (Cx 
+ 1,y) (x +1,y,—-1), 

3) 判断 pi 与 po 是 否 是 同一 个 点 ， 即 x, 是 否 等 于 x。，yi 是 否 等 于 y,。 如 果 直 到 p, 与 mm 
是 同一 个 点 ， 则 算法 结束 ， 否 则 返回 步骤 2) 继续 跟 踪 。 

【 例 4.6】 探测 法 轮廓 跟踪 实例 

原始 的 二 值 图 像 由 图 4. 27a 所 示 。 按 照 探 测 法 的 基本 过 程 进 行 图 像 轮廓 探测 。 

1) 从 左上 角 开 始 扫描 图 像 ， 直 到 
找到 第 一 个 非 0 像素 p。 ， 记 录 其 坐标 
Xo =1，Yyo =2， 如 图 4. 27b 所 示 。 

2) 逆 时 针 研 究 p。 的 8- 邻 域 (如 图 
4.27b 所 示 ， 其 中 虚线 框 表 示 的 像素 
po 是 8- 邻 域 的 第 一 个 像素 )， 可 以 发 
现 p,， 记录 其 坐标 x =2，y, =3， 如 
图 4.27c 所 示 。 

3) 逆 时 针 研 究 p, 的 8- 邻 域 ， 可 以 
发 现 p,， 记 录 其 坐标 x, =3，》 =4。 

4) 逆 时 针 研 究 p, 的 8- 邻 域 ， 可 以 
发 现 p;， 记 录 其 坐标 x, =2,， ys =5。 

5) 逆 时 针 人 研究 ps 的 8- 邻 域 ， 可 以 
发 现 p,， 记 录 其 坐标 x =2，》 =6。 











































































































6) 逆 时 针 研究 ps 的 8- 邻 域 ， 可 以 ee 人 
发 现 p;， 记 录 其 坐标 x; =2，y =7。 图 4.27 探测 法 轮廓 跟踪 





7) 逆 时 针 研究 p; 的 8- 邻 域 ， 可 以 发 现 pe。， 记 录 其 坐标 x6 =3,， ye =6。 

8) 逆 时 针 研 究 pe 的 8- 邻 域 ， 可 以 发 现 p,， 记 录 其 坐标 x; =4，y; =6。 
9) 逆 时 针 研 究 pj 的 8- 邻 域 ， 可 以 发 现 ps ， 记 录 其 坐标 xs =5，ys =6。 
10) 逆 时 针 研 究 ps 的 8- 邻 域 ， 可 以 发 现 p, ， 记 录 其 坐标 x。 =6，y。 =5。 
11) 逆 时 针 研 究 p, 的 8- 邻 域 ， 可 以 发 现 Po， 记录 其 坐标 ze =6，yio =4。 
12) 逆 时 针 研 究 po 的 8- 邻 域 ， 可 以 发 现 pl,， 记 录 其 坐标 x, =6,， yl =3。 
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13) 逆 时 针 人 研究 Pi 的 8- 邻 域 ， 可 以 发 现 pi,， 记录 其 坐标 X12 =5,， 》12 =3。 

14) 逆 时 针 研 究 pm 的 8- 邻 域 ， 可 以 发 现 ps ， 记 录 其 坐标 zx =4,， yis =2。 

15) 逆 时 针 研 究 pj 的 8- 邻 域 ， 可 以 发 现 p,,， 记 录 其 坐标 xj =3， yi =2。 

16) 逆 时 针 研 究 pu 的 8- 邻 域 ， 可 以 发 现 ms ， 记 录 其 坐标 xs =2，yis =2。 

最 终 的 轮廓 如 图 4. 27d 所 示 。 

上 述 边界 跟踪 法 过 程 比 较 简单 ， 适 用 于 图 像 边缘 连接 明确 的 情况 。 然 而 ， 实 际 应 用 中 很 
多 图 像 的 边缘 连接 并 不 明显 ， 这 时 可 以 采用 最 大 梯度 跟踪 法 进行 边界 跟踪 ， 其 基本 步骤 可 以 
如 下 描述 : 

1) 计算 图 像 的 梯度 图 ， 从 梯度 图 中 选 出 梯度 最 大 的 点 作为 边界 跟踪 的 第 一 个 起 始点 。 

2) 第 一 个 起 点 的 8- 邻 域 中 选 梯度 最 大 的 点 作为 第 二 个 边界 点 。8- 邻 域 像素 的 分 析 采 用 
逆 时 针 方 向 搜索 ， 并 假设 目标 在 边界 跟踪 方向 的 左 方 。 

3) 以 已 经 确定 的 两 个 边界 点 分 别 作 为 当前 边界 点 C 和 前 一 个 边界 点 P， 每 次 在 以 当前 
边界 点 C 为 中 心 的 3 x3 邻 域 中 选取 下 一 个 边界 点 。 根 据 C 点 和 尸 点 的 位 置 不 同 ， 可 得 到 如 
图 4. 28 所 示 的 8 种 组 合 。 这 里 为 保证 边界 的 光滑 性 ， 每 次 只 在 标 有 阴影 的 三 个 候选 像素 中 
根据 梯度 值 的 大 小 选取 下 一 个 边界 点 。 这 样 得 到 的 边界 为 8- 邻 域 连通 ， 且 没有 大 于 45° 的 转 
折 ( 最 小 曲率 半径 是 1.5 个 像素 ) 。 


图 4.28 8 种 搜索 窗口 
4) 以 上 一 部 确定 的 当前 边界 点 C 作为 新 的 前 一 个 边界 点 P， 而 以 刚 确定 的 新 边界 点 作 
为 新 的 当前 边界 点 C。 继 续 搜索 直到 边界 闭合 为 止 。 继 续 搜索 直到 梯度 绝对 值 小 于 一 个 阔 值 
时 ， 搜 索 停 止 。 
基于 梯度 图 的 边界 跟踪 适用 于 噪声 较 小 图 像 ， 可 确定 出 目标 具有 最 大 梯度 的 边界 ， 也 可 
用 于 将 分 割 出 的 区 域 边界 找 出 来 。 当 图 像 中 噪声 较 大 时 ， 会 出 现 偏离 正确 边界 或 失踪 或 跑 出 
图 像 范 围 的 情况 ， 此 时 可 先 对 梯度 图 进行 平滑 然后 再 开始 搜索 。 
【 例 4.7】 增强 抗 噪 能 力 的 方法 “跟踪 虫 法 



























































































































如 图 4. 29 所 示 ， 跟 踪 虫 是 一 个 长 方形 的 平均 中 
窗口 模板 ， 其 中 各 元 素 一 般 具 有 相同 的 值 ， 模 板 候选 边界 点 
后 部 以 当前 像素 为 中 心 ， 其 轴 沿 当前 搜索 方向 。 en 





在 每 个 搜索 位 置 都 计算 模板 下 所 有 像素 的 平均 梯 SI 
度 ， 然 后 选 模板 前 部 具有 最 大 平均 梯度 值 的 位 置 。 当前 边界 点 _ EC 
作为 下 一 个 边界 位 置 。 这 种 方法 可 看 作 是 利用 上 yp oA HH 
述 利用 八 种 搜索 窗口 方法 的 一 个 大 模板 推广 。 模 上 人 这 办 上 be 江 。 2 。。 
板 越 大 ， 对 梯度 的 平滑 作用 越 强 ， 抗 噪声 能 力也 
越 强 。 这 种 方法 也 可 限定 边界 不 能 急速 地 变化 方 图 4.29 边界 跟踪 平均 窗口 模板 
向 。 

3. Hough 变换 及 线 、 圆 检测 

(1) Hough 变换 及 直线 检测 
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如 果 图 像 分 割 过 程 中 ， 预 先 已 经 知道 目标 的 形状 (直线 、 曲 线 、 圆 等 ) ， 则 可 以 利用 
Hough( 哈 夫 或 霍 夫 ) 变换 进行 检测 。Hough 变换 的 基本 思想 是 ， 建 立 一 种 点 - 线 的 对 偶 性 关 
系 ， 将 图 像 数 据 从 图 像 空间 变换 到 某 个 参数 空间 ， 通 过 分 析 参 数 空 到 情况 来 实 
现 目标 的 检测 。 利 用 Hough 变换 可 以 直接 分 割 出 某 些 已 知 形状 的 目标 ， 并 且 受 噪声 和 曲线 间 
断 的 影响 较 小 。 下 面 以 直线 的 ne 变换 为 例 对 其 基本 原理 进行 介绍 。 

在 图 像 空间 的 直角 坐标 系 里 ， 经 过 点 (x,，y) 的 所 有 直线 均 可 由 下 式 表示 : 

y=px +9 (4.65) 
式 中 ，(x，7) 为 图 像 空间 上 的 点 ; (P，9) 为 参数 空间 上 的 点 ， 即 p 为 斜率 ，g 为 截 距 。 将 式 
(4. 66 ) 经 过 适当 的 变形 后 ， 可 以 表示 为 

q= -px+y (4.66) 
与 式 (4. 65) 相 对 应 ， 式 (4. 66) 可 以 认为 是 参数 空间 里 经 过 点 (p，g) 的 一 条 直线 。 

假设 (x;，y,) 和 (x,，y,) 分 别 为 图 像 空 间 位 于 同一 条 直线 上 的 两 个 不 同 的 点 ， 则 根据 式 
(4. 65) 可 以 得 到 如 下 两 式 : 









































y; =px; +q (4. 67 ) 
y; =px; +q (4. 68 ) 
它们 在 (p，g) 上 对 应 的 表达 式 分 别 为 
q= -Xp+y; (4. 69 ) 
4 = -Xp+y (4.70) 





在 (p，g) 空 间 里 ， 式 (4.69) 和 式 (4.70) 表 示 两 条 不 同 的 直线 。 假 设 它们 相交 于 点 (p'， 
gq ) ， 则 点 (p',，g') 对 应 了 图 像 空 间 里 的 一 条 通过 点 (x;，y;) 和 (wx;，y;) 的 直线 。 同 理 ， 图 像 
空间 中 过 点 (x;,，y;) 和 (x， ») 的 直线 上 的 每 个 点 ， 都 对 应 参数 空间 中 的 一 条 直线 。 这 些 直 
线 族 在 (p，g) 空间 里 均 相 交 于 点 (p',，g')。 这 样 ， 通 过 计算 参数 空 s 间 中 多 条 直线 的 交点 就 可 
以 检测 出 图 像 空间 中 式 (4. 65 ) 表示 的 直线 。 

总 之 ， 图像 空间 中 共 线 的 ”+ qh 
点 对 应 于 参数 空间 相交 的 线 ， Lo:y=0.5x+1 
反之 参数 空间 中 相交 于 同一 点 
的 所 有 直线 在 图 像 空间 里 都 有 ' 
共 线 的 点 与 之 对 应 。 这 就 是 I 
Hough 变换 中 的 点 - 线 对 偶 关 ci 















































Ce 
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系 。 图 4.30 给 出 了 一 个 

Hough 变换 的 点 、 线 的 图 像 空 “9 图 像 空间 Cx， 刀 中 的 一 条 直线 b) 参数 空间 共 点 的 直线 族 
间 与 参数 空间 对 应 关系 示例 。 图 4.30 ”图像 空 间 与 参数 空间 的 对 应 关系 示例 
其 中 ， 图 4. 30a 所 示 为 图 像 空 











间 中 的 直线 及 其 三 个 点 ， 图 4. 30b 所 示 为 参数 空间 中 分 别 与 三 个 点 对 应 的 直线 及 其 交点 。 其 
中 ，(x,y) 空 间 里 的 点 4 对 应 着 参数 空间 中 的 直线 由， 点 B 对 应 着 参数 空间 中 的 直线 L,， 
点 C 对 应 着 参数 空间 中 的 直线 Ce。(p，9d) 空 间 里 的 点 P 对 应 着 (x，y) 空 间 里 的 直线 mo。 
当 被 检测 的 直线 为 垂直 线 时 ，p 的 取 值 可 以 为 无 穷 大 。 为 了 避免 垂直 直线 检测 时 出 现 问 
题 ,通常 在 参数 空间 采用 极 坐 标 系 的 形式 来 表示 直线 ， 即 
p= xcosg +ysin0 0 €|—-90,90] (4.71) 
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这 样 ， 图 像 坐标 系 中 的 一 个 点 (x*，y) 可 以 转变 成 参数 空间 (p，9) 内 的 一 条 正弦 曲线 。 此 时 ， 
Hough 变换 中 的 点 与 直线 之 间 的 对 偶 性 就 转变 成 点 与 正弦 曲线 之 间 的 对 偶 变 换 。 
可 以 证 明 ， 直 角 坐 标 空间 中 共 线 的 点 经 过 Hough 变换 后 ， 它 们 的 正弦 曲线 在 极 坐标 空间 
中 有 一 个 公共 交点 。 也 就 是 说 ， 参 数 空间 上 的 一 点 (9, p)， 对 应 于 直角 坐标 0 一 XY 中 的 一 
条 直线 ， 而 且 它 们 是 一 一 对 应 的 。 
为 了 检测 出 图 像 坐 标 系 中 的 直线 ， 可 以 将 参数 坐标 空间 中 的 0 和 p 进行 量化 ， 如 图 
4. 31b 所 示 。 根 据 直 角 坐 标 中 每 个 点 的 坐标 (x*，y) ， 在 9 的 取 值 范围 内 计算 各 个 p 值 。 若 p 
值 落 在 某 个 量化 小 格 内 ， 便 使 该 小 格 的 累加 计数 器 加 1。 当 直角 坐标 中 全 部 的 点 都 变换 后 ， 
对 小 格 进行 检验 ， 计 数值 最 大 的 小 格 ， 根基 最 大 值 所 对 应 的 参数 值 (0 ,，p“ ) 便 可 以 计算 出 
其 在 直角 坐标 中 的 直线 表达 式 。 
Omax 


Eo Pp. minComin 
p 
max 


y py 

























































































a) 直线 极 坐标 表达 形式 的 参数 几何 示意 b) 将 Pg 平面 的 量化 
图 4.31 Hough 变换 的 直线 检测 
可 见 ， 如 果 用 数组 4(9,p) 记录 量化 后 的 9 及 其 对 应 的 p， 那 么 基于 Hough 变换 的 直线 
检测 可 以 描述 为 
1) 根据 精度 要 求 ， 在 p 和 9 的 取 值 范围 内 对 其 进行 量化 ， 分 别 将 其 等 分 为 m 和 份 ， 
每 一 等 分 用 p; 和 0, 表示 。 
2) 自 上 而 下 、 自 左 而 右 遍 历 图 像 ， 如 果 检 测 到 当前 点 (x*，7y) 是 边缘 目标 点 ， 则 根据 式 
(4.71) 算 出 每 一 个 6 对 应 的 P, 值 。 
3) 根据 9, 和 p; 的 值 对 4 进行 累加 ， 即 
A(0,,p;) = A(O,,p,) +1 (4.72) 
4) 重复 执行 2) 和 3)， 直 到 所 有 的 目标 点 都 处 理 完毕 。 
5) 比较 数组 元 素 值 4(b,p;) 的 大 小 ， 找 到 参数 平面 上 最 大 值 ， 即 找到 了 与 之 对 应 的 由 
式 (4.65) 所 描述 的 直线 ， 同 时 也 可 以 知道 多 少 点 是 共 线 的 。 也 就 是 说 ， 直 线 所 对 应 的 极 坐 
标 参 数 为 




















[106",p |] = argmaxA( 0,,p;) ,i e [0O,nj,ie [0,m| (4.73) 
最 终 检测 到 的 共 线 直线 方程 的 表达 式 为 
p™ =xcos0” +ysing”™ (4.74) 


如 果 检 测 平面 内 不 止 一 条 直线 ， 那 么 可 以 设置 一 个 羡 值 ， 如 认为 4(0,,p,) 的 值 大 于 一 
定 的 阐 值 ， 则 认为 通过 该 点 的 那些 曲线 所 对 应 的 图 像 空 间 中 的 各 个 点 共 线 ; 反之 如 果 4(9,， 
p;) 的 值 较 小 ， 则 认为 通过 该 点 的 那些 曲线 在 图 像 空间 中 的 对 应 点 均 属于 抓 立 点 。 

需要 说 明 的 是 ， 对 p 和 9 的 量化 如 果 过 粗 ， 那 么 直线 参数 就 不 精确 ; 如 果 量化 程度 过 
细 ， 则 计算 量 增加 。 因 此 ， 对 p 和 9 的 量化 要 在 满足 一 定 精度 的 精度 条 件 下 进行 ， 也 要 兼顾 
计算 量 的 问题 。 示 例如 图 4. 32 所 示 。 
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(2) 圆 的 检测 

Hough 变换 不 仅 可 以 检测 直线 和 连接 共 线 点 ， 也 
可 以 用 来 检测 圆 等 其 他 各 类 能 用 解析 式 表 示 的 曲线 。 
下 面 再 看 一 下 圆 的 Hough 变换 。 

对 于 图 像 空间 中 的 一 个 半径 为 r-、 圆 心 在 (a, 65) 
的 圆 ， 其 直角 坐标 系 方程 可 以 表示 为 























(x-a) +(y-60) =7 (4. 75) 
其 极 坐标 表达 式 为 
X =%0 二 rcosg (4.76) 
Ep (4.77) 图 4.32 ”Hough 变换 直线 检测 示例 
那么 在 参数 空间 0-ab 里 ， 圆 的 参数 方程 为 
(a-x) +(b-y) =r (4.78) 
其 极 坐标 表达 式 为 
a =x 一 rcosgO (4. 79 ) 
b=y-rsing (4. 80) 
可 见 ， 对 于 参数 空间 0-ab 里 的 一 个 圆 ， 在 0-xy 空间 里 有 一 个 点 (*，7y) 与 之 一 一 对 应 。 
在 0-xy 中 所 有 共 圆 的 点 ， 它 们 所 对 应 的 0-ab 空间 中 的 圆 都 相交 于 一 点 ， 这 点 就 是 这 些 在 0- 





xy 空间 中 共 圆 点 的 圆心 坐标 。 

从 上 述 分 析 中 可 以 看 出 ,为 了 求解 圆 方程 中 的 三 个 参数 ， 必 须 建 立 一 个 三 维 网 格 和 三 维 
阵列 ， 对 于 0-xy 空间 中 的 一 点 ， 对 应 于 0- 史 空间 中 的 一 个 三 维 二 次 曲面 。 若 该 曲面 经 过 某 
个 小 网 格 ， 则 该 网 格 对 应 的 三 维 计数 单元 的 值 就 加 1。 可 见 检 测 共 圆 点 的 原理 和 方法 与 检测 
共 线 点 是 一 致 的 ， 只 是 计算 量 复 杂 度 增加 了 。 为 了 便于 计算 ， 对 式 (4.79 ) 进行 整理 可 以 得 
到 





a = x -rcos0 一 r = (x -ww)/cosb (4. 81) 
因此 
b=y-rsin3b =y- (x -a)sin0/cos0b = atan0 - xtang + 7 (4. 82) 
式 中 ,9 为 当前 点 的 梯度 角 。 可 见 ， 通过 式 (4. 82 ) 即 可 得 到 圆 在 参数 空间 上 的 映射 ， 同 时 参 
数 由 3 个 变 为 2 个 。 
根据 以 上 原理 ， 基 于 Hough 变换 的 圆 检 测算 法 的 具体 步骤 如 下 : 
1) 根据 精度 要 求 , 在 c 和 2 的 取 值 范围 内 对 其 进行 量化 ， 分 别 将 其 等 分 为 m 和 份 ， 
每 一 等 分 用 六 和 a; 表示 。 
2) 计算 原 图 的 梯度 、 梯 度 方向 及 其 正切 值 。 
3) 自 上 而 下 、 自 左 而 右 遍 历 图 像 ， 如 果 检 测 到 当前 点 (*，y) 是 边缘 目标 点 ， 查 找 当 前 
点 所 对 用 的 梯度 角 正 切 值 ， 然 后 根据 式 (4. 82 ) 算 出 每 一 个 a 对 应 的 5; 值 。 
4) 根据 w 和 访 的 值 对 计数 累加 器 4 进行 累加 ， 即 
Al(aj,b;) = A(a;,b;) +1 (4. 83) 
5) 按照 式 (4. 82 ) 获得 参数 空间 上 的 直线 ， 对 直线 上 的 点 累计 加 1。 
6) 循环 3) 和 5) ， 直 到 所 有 的 点 全 部 处 理 完毕 。 
7) 在 参数 空间 上 找到 累计 值 为 最 大 的 点 ， 即 找到 了 与 之 对 应 的 、 由 式 (4. 82) 描述 的 
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圆心 。 

8) 获得 圆心 坐标 之 后 ， 代 入 图 像 空间 中 圆 的 式 (4.75) ， 即 可 获得 圆 的 半径 。 

梯度 角 及 其 正切 值 的 计算 是 曲线 检测 中 的 基础 ， 下 面 给 出 一 种 计算 方法 。 

计算 梯度 时 ， 可 采用 图 4. 33 所 示 的 模板 。 首 先 用 中 心 像素 与 其 周围 
的 8 个 像素 分 别 求 差分 ， 然 后 取 绝 对 值 为 最 大 的 一 点 为 当前 点 的 梯度 值 。 
当 最 大 值 处 于 1 或 5 的 位 置 ，tan6 = - 1; 当 最 大 值 处 于 2 或 6 的 位 置 ， 
tan0 =0; 当 最 大 值 处 于 3 或 7 的 位 置 ，tang = 1; 当 最 大 值 处 于 4 或 8 的 位 
置 ，tanb = % 。 由 于 图 像 中 去 掉 若 干 个 点 不 影响 对 圆 的 检测 ， 因 此 若 最 大 
值 处 于 4 或 8 的 位 置 上 时 ， 其 梯度 值 及 其 角度 的 正切 值 同 时 置 为 0， 表 明 
该 点 不 参与 运算 。 

除了 能 检测 圆 ( 见 图 4. 34) 等 能 用 解析 形式 表达 的 曲线 外 ，Hough 变换 还 能 够 检测 那些 
复杂 的 、 难 以 用 解析 式 表 达 的 曲线 ， 相关 内 容 可 以 查阅 广义 Hough 变换 的 相关 内 容 。 

4. 曲线 拟 合 \ 

如 果 已 确定 的 边缘 点 很 稀疏 ， 可 
以 通过 它们 用 直线 段 或 样 条 函数 拟 合 
来 获取 边界 段 并 进而 得 到 完整 的 边界 。 

(1) 迭代 终点 拟 合法 

如 图 4. 35 所 示 ， 设 在 边缘 点 4 和 

















图 4.33 梯度 模 
板 示意 图 
























































B 之 间 有 一 些 已 检测 出 的 散布 边缘 点 ， 200F 
希望 通过 它们 中 的 一 些 点 用 若干 直线 pool 

段 把 4 和 B 连接 起 来 。 为 此 ， 首 先 可 和 

用 一 直线 连接 4 和 BB， 然后 计算 从 各 

个 散布 边缘 点 到 这 条 直线 的 垂直 距离 。 -200[ -er 

将 对 应 距离 最 大 的 点 C 当 作 4 和 B 间 —300 0 100 0 100 200 300 
边界 中 的 一 个 点 ， 它 有 分 别 连 接点 4 图 4.34 Hough 变换 圆 检 测 示例 








和 点 的 两 个 分 支 。 对 这 两 个 分 支 每 个 分 支 重 复 上 述 过 程 ， 直 到 没有 边缘 点 到 已 建立 的 直 

线段 集合 的 距离 大 于 某 个 预先 确定 的 距离 为 止 。 图 4. 42c 所 示 是 考虑 点 D 的 两 个 分 文 ， 设 点 

和 点 G 与 对 应 线段 的 距离 均 小 于 预先 确定 的 允许 距离 ， 不 许 进一步 考虑 ， 所 以 线段 4BCD 

DS PDS 如 果 将 上 述 过 程 绕 目 标 一 周 即 可 得 到 多 变形 边界 ， 类 似 于 
用 分 腊 方 法 逼近 多 变形 边界 技术 。 











a) b) CO) 





图 4.35 和 迭代 终点 拟 合 示例 
(2) 最 小 方 均 误 差 曲线 拟 合 
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给 定 一 组 边缘 点 | (x;,y;) ,i = 1,2,…,N| ,一 种 常用 的 曲线 拟 合 方法 是 找到 一 个 函数 
f(x) 以 最 小 化 下 列 误差 ， 即 


MSE = 吝 > [Ly -Ax)] 


如 果 f(x) 是 一 条 抛物 线 ， 它 的 方程 可 表示 为 


f(x) = co tox + cx 


(4. 84) 


(4. 85) 


则 拟 合 就 是 要 确定 式 (4. 85 ) 中 的 各 个 系数 。 下 面 借助 矩阵 来 推导 一 种 解法 ， 设 


则 误差 列 和 矩阵 为 


这 样 方 均 误 差 是 





2 


1 





Yi Wl NM 
2 Co 
: BS 
yy 1 xy xy 
E=Y-MC 
MSE = 也 
NN 


对 C 的 各 个 元 素 求 导 ， 并 取 导 数 为 零 可 解 得 





C = [MA IM'Y] 


(4. 86 ) 


(4. 87 ) 


(4. 88) 


(4. 89) 


C 中 的 元 素 给 出 最 小 方 均 误差 的 拟 合 系数 。 如 果 边 界 点 数 与 拟 合 系数 个 数 相 同 ，M 是 一 个 
方 阵 ， 则 可 以 直接 求 逆 





国 值 分 割 


国 值 分 


4.4 


坐 | 


电 








| 


属于 区 域 分 


定 | 
二 





C =M 了 








连通 的 边界 定义 不 交 丢 的 区 域 ， 因 此 阔 值 分 割 是 图 像 分 
阅 值 分 割 的 基本 原理 


上 最 常用 的 图 像 模型 : 假设 图 像 由 多 个 区 域 组 成 ， 每 个 区 域内 部 由 灰 度 相同 或 相 
近 的 像素 组 成 ， 而 不 同 区 域 交 界 处 的 像素 在 灰 度 值 上 有 和 较 明 
合理 的 国 值 ， 并 比较 各 个 像素 与 国 值 的 大 小 关系 来 区 分 不 同 的 区 域 。 由 此 可 见 ， 立 值 分 


4.4.1 


本 习 


[ 





国 值 分 


法 主要 包括 以 下 两 个 步骤 : 


1) 确定 需要 的 分 
2) 将 分 


二 


[3 





其 中 ,确定 阅 值 是 分 





来 。 根 据 阔 值 的 多 少 ， 
(1 ) 单 赣 值 
单 关 值 分 和 


和 | 


[ 





上装 值 。 


定 | 
二 





| 的 
国 值 分 


| 算法 仅 用 一 个 靖 值 即 可 实现 图 像 的 分 





主 | 


[3 





三 | 


\ 





的 差别 。 因 此 ， 














上 国 值 与 像素 值 比较 划分 像素 。 


(4. 90) 


| 算法， 具有 概念 直观 、 易 于 实现 的 特点 。 效 值 分 割 能 用 封闭 而 且 
I 算法 中 应 用 最 广泛 的 一 类 算法 。 


可 以 通过 设置 
I 算 


符 | 


电 








关键 。 如 果 能 
I 算法 可 以 分 为 以 下 两 种 。 


符 | 


[1 





符 | 


电 








|， 把 图 像 分 成 目标 与 








定 一 个 合适 的 阐 值 ， 即 可 方便 地 将 图 像 分 


坐 | 


电 





I 开 


了 5 国 . 
月 时 


两 大 部 分 


(如 图 4. 36a 所 示 ， 其 中 So 表示 后 景 ，S, 表示 前 景 ) 。 其 基本 思想 可 以 描述 为 ， 先 确定 一 个 
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人 处 于 图 像 灰 度 取 值 范 围 之 中 的 灰 度 立 


值 ， 然 后 将 图 像 中 各 个 像素 的 灰 度 值 (s) 
与 这 个 阔 值 进行 比较 ， 并 根据 比较 结 




















果 将 对 应 的 像素 (分 割 ) 划分 为 两 类 ; 人 AN 
像素 灰 度 值 大 于 阅 值 的 为 一 类 ， 像素 
灰 度 值 小 于 国 值 的 为 为 一 类 ， 灰 度 值 “。) 具有 两 个 灰 度 区 域 的 图 像 b) 具有 多 个 灰 度 区 域 的 图 像 
等 于 羡 值 的 像素 可 以 归属 于 任意 一 Sn 
类 ， 全 | a SS 局 J 信 王八 \ 全 、 
单 闪 值 分 割 后 的 图 像 g(x,y) 的 表达 式 可 以 表示 为 
人 wy7) > 了 4 91 
sc = {0 0 (4.91) 
式 中 ,7 为 阔 值 。 可 见 g(x，7) 是 一 幅 二 值 图 像 。 
(2) 多 靖 值 








如 果 图 像 中 有 多 个 灰 度 值 不 同 的 区 域 ( 见 图 4.36b)， 那 么 可 以 选择 用 多 个 阐 值 把 每 个 像 
素 分 到 合适 的 类 别 中 去 。 这 种 利用 多 个 国 值 实现 的 图 像 分 割 算法 称 为 多 国 值 分 割 方法 。 一 般 
情况 下 ，n 个 立 值 可 实现 n+1 个 区 域 的 分 割 。 假 设 图 像 中 存在 n+1 个 区 域 ， 每 个 区 域 均 符 
合 阀 值 分 割 的 图 像 模 型 ， 此 时 分 割 后 的 图 像 可 表示 为 
80 fliy) 三 To 
81 To < fi,7)) <7T 























8(i,) = (4.92) 





git Ts <fi,j) 三 也 
gs Ta <Ai))sT, 
式 中 ，7T,，7T, ，…， 了 , 是 一 系列 的 分 制 阔 值 ， 且 满足 有 <7 <… 
g, 分 别 为 处 理 后 各 个 区 域 的 输出 值 或 某 种 标记 。 

无 论 单 阔 值 分 割 还 是 多 阔 值 分 割 ， 分 割 结果 中 都 可 能 出 现 不 同 区 域 具有 相同 标号 或 区 域 
值 的 情况 。 这 是 因为 取 阔 值 分 割 时 ， 只 考虑 了 像素 本 身 的 值 ， 未 考虑 像素 的 空间 位 置 。 所 以 
根据 像素 值 划 分 到 同一 类 的 像素 可 能 分 属于 图 像 中 不 相连 通 的 区 域 ， 这 往往 需要 借助 一 些 对 
场景 的 先 验 知识 来 进一步 确定 目标 区 域 。 

假设 f(x,y) 代表 像素 点 (x，y) 处 的 灰 度 值 , p(x,y) 代表 在 该 点 邻 域 的 某 种 局 部 性 质 ， 
可 以 用 下 式 来 描述 阐 值 分 割 过 程 : 

7T = Tlx,y,f(x,y) ,p(x,y)] (4.93) 
即 阔 值 的 选取 可 能 与 像素 位 置 、 灰 度 值 及 当前 像素 的 邻 域 性 质 等 因素 有 关 。 根 据 闪 值 选 取 所 
依赖 的 相关 因素 ， 可 以 将 阔 值 分 割 方法 分 为 三 类 

1) 全 局 阀 值 ”如果 阔 值 了 的 选取 仅 取 决 于 图 像 藉 度 值 凡 xz,y) ， 这 种 阔 值 就 可 以 称 为 全 
局 闪 值 。 全 局 阔 值 法 一 般 只 使 用 一 个 浆 值 ， 经 典 的 选取 方法 是 基于 图 像 的 直方 图 来 实现 图 像 
的 分 割 。 全 局 浆 值 法 也 称 为 点 阔 值 法 。 常 用 的 全 局 阔 值 法 包括 双 峰 法 、P 参数 法 、 均 匀 性 度 
量 法 、 类 间 最 大 距离 法 、 最 大 烂 法 、 最 大 类 间 类 内 方差 比 法 等 。 

2) 局 部 阔 值 法 ”局 部 阔 值 法 中 净值 7 的 选取 取决 于 图 像 灰 度 值 f(x,y) 和 该 点 邻 域 的 某 





> < 了 < 20， 21， 
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些 性 质 p(x,y) (如 区 域内 各 像素 的 值 、 相 邻 像素 值 的 关系 等 ) 。 这 类 阔 值 技术 也 被 称 为 区 域 
相关 技术 。 局 部 阔 值 法 将 原始 图 像 划 分 成 较 小 的 图 像 ， 并 对 每 个 子 图 像 选 取 相 应 的 阔 值 。 在 
半 值 分 割 后 ， 相 邻 子 图 像 之 间 的 边界 处 可 能 产生 灰 度 级 不 连续 的 情况 ， 因 此 需要 平滑 技术 进 
行 排除 。 局 部 阔 值 法 常用 的 方法 包括 灰 度 差 直方 图 法 、 微 分 直方 图 法 、 灰 度 -局 部 灰 度 均值 
散布 图 法 、 二 维 粹 法 等 。 

3) 自 适 应 国 值 法 ” 阔 值 的 选取 除了 与 图 像 灰 度 值 fx,y) 和 该 点 邻 域 的 某 种 局 部 特性 
p(x,y) 有 关外 ， 还 与 像素 的 坐标 位 置 (x，y) 有关。 这 类 立 值 技术 也 称 为 动态 闵 值 法 或 者 自 
适应 阔 值 法 ， 常 用 的 方法 包括 闪 值 插值 法 、 水 线 冰 值 算法 等 。 

总 之 ， 冰 值 的 选取 是 国内 外 选择 研究 的 热点 之 一 。 然 而 ， 到 目前 为 止 ， 还 没有 一 种 通用 
的 对 全 部 图 像 都 适用 的 冰 值 选取 方法 ， 一 般 一 种 阔 值 选取 方法 只 针对 一 类 图 像 有 效 而 对 其 他 
图 像 分 割 的 效果 就 不 是 很 理想 。 下 面 介绍 几 种 基本 的 冰 值 选取 算法 。 


4. 4. 2 双 峰 法 


在 一 些 简单 的 图 像 中 ， 物 体 的 灰 度 分 布 比 较 有 规律 ， 背 景 与 各 个 目标 在 图 像 的 直方 图 上 
各 目 形 成 一 个 波峰 ， 即 区 域 与 波峰 一 一 对 应 ， 每 两 个 波峰 之 间 形 成 一 个 波 谷 。 那 么 ， 选 择 双 
峰之 间 的 波 谷 所 代表 的 灰 度 值 作为 立 值 ， 即 可 实现 两 个 区 域 的 分 割 ， 如 图 4.37 所 示 。 以 此 
类 推 ， 就 可 以 在 图 像 中 分 离 出 各 个 有 意义 的 区 域 。 

双 峰 法 是 一 种 简单 有 效 的 阐 值 确定 方法 ,但 是 它 要求 图 像 
的 灰 度 直方 图 必须 具有 双 峰 性 ， 即 背景 与 目标 区 域 所 对 应 的 直 
方 图 呈 明 显 的 双 峰 。 在 波峰 间 的 波 谷 平坦 、 各 区 域 直方 图 的 波 
形 重重 等 情况 下 ， 用 双 峰 法 难以 确定 阀 值 ， 必 须 寻 求 其 他 方 
法 。 
































方 一 上 
【 例 4. 8】 双 峰 法 阔 值 确定 实例 4. 37 “ 双 噬 法 示意 图 
图 4.38a 给 出 了 原始 图 像 ， 在 一 个 颜色 比较 单纯 的 背景 上 有 一 片 树叶 ， 图 4 38b 给 出 该 


图 像 的 直方 图 。 
0—30-100 1 0 250 300 A 


a) 原 图 b) 直方 图 c) 阀 值 为 140 的 分 割 效果 d) 阀 值 为 171 的 分 割 效 果 
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图 4.38 双 峰 法 图 像 分 割 实例 
从 图 4.38b 中 可 以 看 出 ， 原 图 的 直方 图 具有 良好 的 双 峰 性 ， 表 明 图 像 的 内 容 大 致 分 为 两 
个 部 分 ， 分 别 分 布 在 两 个 山峰 附近 。 其 最 大 峰值 分 别 是 110 和 232， 靖 值 可 以 取 两 峰 间 的 谷 
底 点 ， 例 如 可 以 取 阔 值 为 171。 图 4. 38c ~ d 分 别 给 出 了 浆 值 为 140、171 时 获取 的 二 值 图 
像 。 
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4. 4.3 Jp 参数 法 


当 不 同 区 域 ( 即 目 标 ) 之 间 的 灰 度 分 布 有 一 定 的 重合 时 ， 双 峰 法 的 效果 就 很 差 。 如 果 ， 
预先 知道 每 个 目标 占 整个 图 像 的 比例 p， 则 可 以 采用 p 参数 法 进行 分 割 。P 参数 法 的 基本 思 
想 是 ， 选 择 一 个 阔 值 7， 使 前 景 目标 物 所 占 的 比例 为 p， 背 景 所 占 比例 为 1 -p。 下 面 以 图 像 
中 包括 两 个 区 域 的 情况 来 分 析 p 参数 法 的 基本 步 又。 假设 整个 直方 图 中 低 灰 度 区 域 所 占 的 比 
例 为 p,， 则 p 参数 法 的 具体 步骤 可 以 如 下 描述 : 

1) 计算 图 像 的 直方 图 分 布 p(7,)。 其 中 k=0，1，…, N -1， 表 示 图 像 的 灰 度 等 级 ;rr， 
表示 每 个 等 级 的 灰 度 值 。 

2) 从 最 低 灰 度 值 开 始 ， 计 算 图 像 的 累积 分 布 直方 图 


k 
Pi(k) = Splr) k=0,1,,N-1 (4.94) 
j=0 























3) 计算 阔 值 7， 有 
T = argmin| Pu(k) -pl,k=0,1,.…,N-1 (4.95) 
也 就 是 说 ， 阔 值 就 是 与 p, 最 为 接近 的 累积 分 布 函 数 P, (Ek) 所 对 应 的 灰 度 值 。 
如 果 图 像 中 有 三 个 区 域 ， 并 且 假 设 整 个 直方 图 中 低 灰 度 区 域 所 占 的 比例 为 p,， 高 灰 度 
区 所 占 的 比例 为 p ， 则 低 灰 度 区 的 分 割 同 上 述 方法 一 臻 。 高 灰 度 区 的 累积 函数 分 布 计算 过 
程 正好 相反 ， 其 直方 图 的 累加 方向 应 从 高 端 到 低 端 。 令 P,(k) 为 从 高 灰 度 值 到 低 灰 度 值 的 
累积 分 布 函数 ， 则 有 





Petn) = p(n) (4. 96) 
则 从 图 像 中 分 离 出 高 灰 度 区 的 阔 值 为 
7T, = argmin| P,(k) -p,| (4.97) 
如 果 图 像 的 区 域 数 大 于 3， 则 可 在 分 离 高 、 低 两 端 区 域 后 的 图 像 中 继续 用 上 述 方法 进行 
分 割 ， 只 是 要 注意 分 割 过 程 中 的 起 始 灰 度 值 不 是 0 和 N -1， 而 是 7、 了 等 。 
由 于 这 种 方法 需要 预先 知道 各 个 区 域 的 p 值 ， 因 此 被 称 为 p 参数 法 。 
【 例 4.9】 p 参数 法 图 像 分 割 实例 
本 例 仍 以 图 4. 39a 为 例 进行 p 参数 法 图 像 分 割 ， 假设 p =0.4。 图 4.39c 给 出 该 图 像 的 累 
积 直 方 图 。 
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0—30 0 100 50 300 0 — 50 100 80 200250300 
a) 原 图 b) 直方 图 c) 累积 直方 图 d) 阀 值 为 200 时 的 分 制 效果 
图 4.39 p 参数 法 图 像 分 割 实例 
从 图 4. 39c 中 可 以 看 出 ， 当 P, =0.4， 其 对 应 的 灰 度 值 为 200， 因 此 分 割 间 值 了 =200。 
图 4. 39d 给 出 了 立 值 为 200 时 获取 的 二 值 图 像 。 
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4. 4.4 最 小 类 内 方差 法 


当 图 像 直方 图 无 明显 的 双 峰 ， 或 双 峰 低谷 都 不 明显 ， 而 且 各 个 区 域 的 面积 又 不 可 知 时 ， 
可 以 采用 最 大 方差 自动 阔 值 法 来 获取 满意 的 阔 值 。 最 小 类 内 方差 法 也 称 为 均匀 性 度量 法 。 其 
设计 思想 是 ， 在 最 佳 阔 值 下 ， 分 割 后 的 目标 内 部 各 个 像素 之 间 的 性 质 应 该 最 为 接近 。 区 域内 
的 像素 性 质 的 相似 程度 可 以 用 类 内 方差 (例如 同一 个 区 域内 像素 的 灰 度 方差 ) 来 衡量 。 为 了 
寻找 最 小 类 内 方差 所 对 应 的 阔 值 ， 可 以 采用 多 次 尝试 的 方法 来 寻找 最 佳 阔 值 。 下 面 以 两 个 区 
域 为 例 来 分 析 基 于 多 次 尝试 的 最 小 类 内 方差 法 。 

假设 /表示 阔 值 尝试 的 次 数 ， 当 前 阔 值 记 为 rm ， 初 始 时 =0， 则 最 小 方差 法 的 基本 步 
又 如 下 : 

1) 假设 当前 阔 值 为 7 ， 并 将 图 像 分 为 Cm 和 CM 两 个 区 域 ， 即 
1 f(x,y) < 70 





















































g(x%,y) = (4. 98 ) 
0 f(x,y) > TW 
2) 计算 两 个 区 域 中 的 像素 百分比 p 
NY 
0) 
"my (4.99) 
式 中 ，N 为 图 像 中 像素 的 总 数 ; N9 为 第 7 次 间 值 分 割 中 区 域 CW 的 像素 个 数 。 
3) 分 别 计算 两 类 的 均值 和 方差 
un = 3 fx,y) (4. 100) 
ciflx,y) e Chi) 
oo = > (xy) -uv (4.101) 
flx,y) EC 人 
4) 计算 总 体 类 内 方差 
ou(j) = p101()) + p202()) (4. 102) 


5) 令 j=j+1， 返回 步骤 1) 尝 试 其 他 国 值 ， 并 根据 1) ~4) 计 算 两 类 的 方差 。 
6) 挑选 最 小 类 内 方差 所 对 应 的 阔 值 ， 即 7 为 
7 了 ”= argmin(ao: (7)) (4. 103 ) 

可 见 最 小 方差 法 是 一 种 自动 阔 值 选择 方法 ， 整 个 过 程 不 需要 人 工 设 定 其 他 参数 。 它 不 单 
适用 于 两 个 区 域 的 分 割 ， 也 可 以 扩展 到 多 区 域 分 割 中 去 。 

假设 当前 的 一 系列 阔 值 为 7” ， 将 图 像 分 割 成 n 个 区 域 5S,，S,，…，5S,_1。 其 中 , j 表 
示 党 试 次 数 , 守 表示 第 几 个 阔 值 , o; (7) 表示 第 j 次 迭代 过 程 中 第 i 个 区 域 的 方差 。 那 么 基于 
最 小 方差 的 多 区 域 分 割 算法 基本 步骤 与 基于 最 小 方差 的 2 区 域 分 割 算法 基本 类 似 ， 只 需 对 
1) 和 4) 做 一 点 变动 。 其 中 ，1) 应 当 根 据 式 (4. 92) 完成 图 像 的 分 制 ，4) 的 总 体 方差 计算 应 该 
根据 下 式 进 行 : 
































oO = 二 pa (4. 104) 
4.4.5 最 大 类 间距 离 法 
最 大 类 间 法 是 另外 一 种 简单 的 自动 阐 值 选取 方法 。 其 基本 思想 是 ， 在 最 佳 阔 值 条 件 下 ， 
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目标 区 域 与 背景 区 域 之 间 的 差异 应 该 最 大 。 这 里 的 差异 用 相对 类 间距 来 衡量 。 假 设 需 要 将 图 
像 分 为 目标 和 背景 两 个 部 分 ， 那么 基于 最 大 类 间距 离 法 的 图 像 分 割 算法 的 基本 步骤 可 以 如 下 
描述 。 

假设 ;表示 阅 值 尝试 的 次 数 ， 当 前 阐 值 记 为 7?”， 初 始 时 j=0。 

1) 假设 当前 羡 值 为 7 ， 并 将 图 像 分 为 CW 和 CW 两 个 区 域 。 

2) 按照 式 (4. 99 ) 计 算 两 个 区 域 中 的 像素 百分比 p2 。 

3) 按照 式 (4. 100) 计 算 两 个 区 域 的 均值 。 

4) 计算 两 个 区 域 的 相对 类 间距 ， 即 

| (wu) TY ) (um 于 7 ) | 




















SG) = (ur Su ) (4. 105) 
5) 令 j=j+1， 返 回 步 骤 1)， 尝 试 其 他 阔 值 ， 并 根据 1) ~4) 重 新 计算 两 个 区 域 的 相对 
类 间距 SC7) 。 
6) 挑选 最 大 相对 类 间距 所 对 应 的 阔 值 7* 


人 ”三 ee (4. 106) 
该 方法 同样 也 可 以 扩展 到 多 区 域 分 割 ， 其 基本 原理 可 以 参照 4.4.4 中 的 基于 最 小 类 内 方 
差 的 多 阀 值 分 制 算 法 。 


4. 4.6 ”最 大 类 间 类 内 方差 比 法 


最 大 类 间 类 内 方差 比 法 综合 考虑 了 类 内 与 类 间 的 差异 性 。 其 基本 思想 是 ， 找 一 个 /一 组 
阅 值 ， 使 各 类 之 间 的 差异 性 最 大 ， 同 时 又 保证 同一 个 Be ao 
类 内 与 类 间 数 据 分 布 的 差异 性 依然 采用 方差 来 描述 。 下 面 以 将 图 像 分 割 为 目标 区 和 背景 图 
个 区 域 为 例 ， 说 明 最 大 类 间 类 内 方差 比 法 的 基本 步 又 : 

1) 按照 式 (4. 107) 计算 整个 图 像 的 均值 v 

i (4. 107) 

2) 假设 当前 闵 值 为 7 ”， 并 将 图 像 分 为 CW” 和 CW 两 个 区 域 。 

3) 按照 式 (4. 99 ) 计算 两 个 区 域 中 的 像素 百分比 pm 和 pl? 。 

4) 按照 式 (4. 100) 计 算 两 个 区 域 的 均值 。 

5) 计算 两 个 区 域 的 类 内 方差 mi [ 式 (4. 102) ] 和 类 间 方差 cz ， 即 

Oot) =PPC -wu) +pY (oO -7 (4. 108) 

6) 计算 类 间 类 内 方差 的 比值 ， 有 






































oi()) 





7(]) = gy (4. 109) 
7) 令 j=j+1， 返 回 步骤 2) ， 尝 试 其 他 国 值 ， 并 根据 步 又 2) ~6) 重 新 计算 两 个 区 域 的 
类 间 类 内 方差 的 比值 7(7) 。 
8) 挑选 最 大 相对 类 间距 所 对 应 的 阔 值 7* 
7” = ee (4.110) 


4. 4.7 最 大 焕 法 
最 大 科 法 即 最 大 妫 阔 值 图 像 分 割 方法 ， 是 应 用 信息 论 中 灼 概念 与 图 像 闽 值 化 技术 对 图 
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像 进行 分 割 的 一 种 方法 。 其 目标 是 选择 最 佳 阔 值 7” ， 使 分 割 后 的 图 像 目 标 区 域 与 背景 区 域 
两 部 分 灰 度 统计 的 信息 量 最 大 。 

根据 上 述 基 本 原理 ， Ne 总 结 如 下 

1) 计算 整个 图 像 的 概率 直方 图 p(i) ,i=0, 1, 2,…，255。 

2) 假设 当前 羡 值 为 7” ， A CW 和 CW 两 个 区 域 。 
3) 按照 式 (4. 111) 分 别 计算 两 个 区 域 中 的 平均 相对 彤 尼 7 和 EE 


E10) =- > (六 人 | (4.111) 

















7T(7) 





,) p(i) p(i) 
E,(j) = | pr pr yy ) (4.112) 
其 中 
7(7) 
P(TW) = 7 ) (4.113) 
4) 按照 式 (4. 112) 计 算 两 个 区 域 的 炉 E()) ， 
E(j) = Ei()) ee (4.114) 
5) 令 J=J+1， 返 回 步骤 2) ， 符 试 其 他 闽 值 ， 并 根据 步 又 2) ~4) 重 新 计算 两 个 区 域 的 
炉 E()。 
6) 挑选 最 大 炉 所 对 应 的 病 值 7”， 
= 0 (US 


4.4.8 ”自动 迭代 法 

阔 值 也 可 以 通过 迭代 的 方式 来 获 了 到， 假设 /为 只 代 次 数 ， 其 初始 值 为 0， 那 么 迭代 阔 值 
的 获取 步骤 可 以 归纳 如 下 : 

1) 选择 一 个 初始 阐 值 7(;}) ， 通 常 可 以 选择 图 像 的 平均 灰 度 值 作为 初始 阔 值 。 

2) 用 70) 分割 图 像 ， 根 据 式 (4.91) 将 图 像 分 成 2 个 区 域 C? 和 C0 。 

3) 根据 式 (4. 100) 计 算 区 域 CW 和 CW 的 平均 灰 度 值 w? 和 ww 。 

4) 计算 新 的 门限 值 ， 即 

















(让 
十 
T(j+1) = 7 


5) 令 j=Jj+1， 重 复 步 又 2) ~4) ， 直 到 阔 值 不 再 发 生变 换 为 止 。 


4.4.9 直方 图 变换 法 

直方 图 变换 法 的 基本 思想 是 ， 利 用 像素 邻 域 的 局 部 性 质变 换 原 始 直方 图 为 新 的 直方 图 。 
这 个 新 直方 图 与 原 直方 图 相 比 ， 或 者 峰之 间 的 谷 变 深 了 ; 或 者 谷 转变 为 峰 ， 更 容易 检测 了 
这 里 常用 的 像素 邻 域 性 质 是 像素 的 灰 度 值 。 这 种 方法 适合 于 受 噪 声 等 影响 ， 直方 图 原本 分 离 
的 峰之 间 的 谷 被 填充 的 图 像 ， 或 直方 图 中 对 应 目标 和 背景 的 峰 相 距 很 近 或 大 小 差 很 多 的 图 
像 。 此 时 ， 直 方 图 基本 是 单 峰 的 ， 虽然 可 能 峰 的 一 侧 有 缓坡 或 一 侧 比 另 一 侧 陡 峭 ， 但 检测 峰 
谷 比较 困难 。 这 类 问题 除 利 用 像素 自身 性 质 外 ， 还 可 利用 像素 邻 域 的 局 部 性 质 。 

图 4. 40b 给 出 了 图 像 中 一 段 边缘 的 剖面 ( 横 轴 为 空间 坐标 ， 竖 轴 为 灰 度 值 )， 这 段 剖 面 


(7) 
(4.116) 

















可 分 为 、 开 、 亚 三 个 部 分 。 
中 ， 工 和 亚 两 部 分 分 别 对 应 背景 
和 目标 ， 卫 对 应 边界 部 分 。 

根据 剖面 得 到 的 灰 度 直方 图 
如 图 4. 40a 所 示 ( 竖 轴 为 图 像 灰 
度 值 ， 横 轴 为 灰 度 值 统计 值 )， 
三 段 点 夯 线 分 别 给 出 了 边缘 剖面 
中 三 部 分 各 自 的 灰 度 值 统 计 值 ， 
相当 于 将 直方 图 左旋 90°。 

对 图 4. 40b 所 示 的 边缘 剖面 
求 取 梯度 得 到 图 4. 40d 所 示 的 曲 
线 。 可 见 对 应 目标 或 背景 区 域内 
部 像素 的 梯度 值 小 而 对 应 目标 和 
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i 
J COD I 
I 
Hf 0)] 本 
a) 灰 度 直方 图 b) 边缘 剖面 曲线 x 
人 人 
f'(%) 
UBM) oe 
c) 梯度 直方 图 d) b 的 梯度 曲线 中 
图 4.40 边缘 及 梯度 直方 图 


背景 之 间 过 渡 区 的 像素 梯度 值 大 。 梯 度 直方 图 如 图 4. 40c 所 示 ( 坚 轴 为 梯度 值 ， 横 轴 为 梯度 


值 统计 值 ， 相 当 于 将 直方 图 
区 和 过 渡 区 。 











左旋 90°) ,梯度 直方 图 有 两 个 峰 ， 








根据 上 述 讨 论 ， 可 将 图 




















分 别 对 应 目标 与 背景 的 内 部 


像 的 直方 图 进行 变换 ， 加 大 直方 图 中 峰 谷 之 间 的 距离 。 根 据 图 像 


的 模型 ， 目 标 和 背景 内 部 的 像素 具有 和 较 低 的 梯度 值 ， 而 它们 边界 上 的 像素 具有 较 高 的 梯度 


值 。 如 果 做 出 仅 具 有 低 梯度 值 像素 的 直方 图 ， 那 么 新 直方 图 
基本 不 变 。 但 因为 减少 了 一 些 边缘 点 ， 所 以 谷 应 比 原 直 方 区 








中 对 应 目标 或 背景 内 部 点 的 峰 应 














要 深 。 


更 一 般 地 ， 可 计算 加 权 直 方 图 ， 其 中 赋 给 具有 低 梯度 值 像素 的 权重 大 一 些 。 例 如 ， 设 一 
个 像素 点 的 梯度 值 为 ag， 则 在 统计 直方 图 时 可 给 它 加 权 1Z(1 + g)”。 这 样 如 果 该 像素 梯度 值 





























则 它 得 到 最 大 权重 1; 如 果 像 素 具 有 很 大 梯度 值 ， 则 它 得 到 的 权重 将 微乎其微 。 这 样 
中 ,边界 点 页 献 小 而 内 部 点 页 献 大 ， 峰 基本 保持 不 变 而 谷 加 深 ， 峰 谷 之 间 差 距 会 





为 零 ， 

加 权 直 方 图 

加 大 ， 如 图 4.41 所 示 。 
人 人 
了 2 
SS | | 
2 sy 1 
只 RI 1 
~ | 
0 EE 0 

图 4.41 变换 直方 图 示例 
4. 4. 10 ”连通 区 域 标记 





数字 图 像 经 过 分 割 后 得 到 多 个 目标 区 域 ,需要 通过 标记 对 它们 进行 区 分 。 











为 此 必须 给 不 


同 的 区 域 分 配 不 同 的 标记 。 下 面 介 绍 一 种 实用 的 连同 区 域 的 标记 算法 一 一 顺序 标记 法 。 
顺序 标记 法 通常 通过 对 图 像 进行 从 左 到 右 、 从 上 到 下 做 两 次 扫描 来 实现 标记 。 在 扫描 过 
程 中 ， 如 果 发 现 某 个 像素 的 灰 度 值 由 0 变 为 1 且 没 有 分 配 标记 ， 则 给 该 像素 分 配 一 个 没有 使 
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用 的 标记 ; 如 果 当 前 正 被 扫描 的 像素 值 为 1， 则 根据 其 与 邻 域 像素 的 连通 性 对 其 进行 标记 ; 
如 果 当 前 像素 与 多 个 目标 相连 通 ， 则 可 以 认为 这 些 目标 实际 上 是 同一 个 ， 并 把 它们 连接 起 
来 。 下 面 以 4- 邻 域 连通 的 情况 为 例 进行 分 析 。 

在 对 图 像 进 行 从 左 到 右 、 从 上 到 下 的 扫描 过 程 中 ， 如 果 发 现 当 前 像素 的 灰 度 值 是 0， 就 
移动 到 一 个 扫描 位 置 ， 如 果 当 前 像素 的 灰 度 值 为 1， 检 测 该 像素 左边 和 上 边 的 两 个 邻近 像 
素 ， 并 按照 如 下 规则 进行 标记 : 

1) 如 果 该 像素 左边 和 上 边 的 两 个 邻近 像素 的 灰 度 值 都 是 0， 则 给 当前 像素 分 配 一 个 新 
的 标记 ; 

2) 如 果 该 像素 左边 和 上 边 的 两 个 邻近 像素 只 有 一 个 像素 的 灰 度 值 为 1， 则 把 灰 度 值 为 1 
的 像素 的 标记 赋 给 当前 像素 ; 

3) 如 果 该 像素 左边 和 上 边 的 两 个 邻近 像素 的 灰 度 值 都 是 1 且 有 相同 的 标记 ， 则 把 该 标 
记 赋 给 当前 像素 ; 

4) 如 果 该 像素 左边 和 上 边 的 两 个 邻近 像素 的 灰 度 值 都 是 1 且 有 不 同 的 标记 ， 则 把 其 中 
一 个 标记 赋 给 当前 像素 ， 并 做 个 记号 表明 这 两 个 标记 等 价 ， 即 两 个 近邻 像素 通过 当前 像素 连 
接 在 一 起 。 

扫描 结束 时 ， 将 所 有 等 价 的 标记 对 赋予 一 个 惟一 标记 ， 最 后 再 重新 进行 扫描 ， 将 各 个 等 
价 对 重新 用 新 标记 进行 标注 。 

对 于 8- 邻 域 连通 的 情况 ， 可 采用 类 似 的 方式 ， 区 别 仅 是 除了 对 当前 像素 的 左边 和 右边 的 
两 个 像素 进行 考察 外 ， 还 需要 对 左上 角 和 右上 角 的 两 个 像素 进行 检查 。 

【 例 4.10】 顺序 标记 法 应 用 实例 
图 4. 42 给 出 了 一 个 输入 图 像 分 割 后 产生 的 二 值 图 像 /(x,y) ， 按 照 上 述 顺 序 扫描 算法 对 
各 个 区 域 进行 标记 。 
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加 关键 中 间 结果 4 及 初始 检测 结果 。 8) 等 价 标记 合并 后 结果 hb) 标记 调整 后 的 结果 
图 4.42 4- 邻 域 连通 顺序 标记 法 应 用 实例 
1) 按照 从 左 到 右 、 从 上 到 下 的 顺序 扫描 ， 找 到 第 一 个 数值 为 1 的 像素 f(1,0) ， 并 赋予 
标记 4。 
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2) 继续 扫描 ， 找 到 第 二 个 数值 为 1 的 像素 f(2,0) ， 并 考察 其 4- 邻 域内 像素 的 标记 ， 由 
于 其 左边 像素 的 标记 为 1， 因此 赋予 像素 f(2,0) 标记 4。 

3) 继续 扫描 ， 找 到 第 三 个 数值 为 1 的 像素 f(4,0) ， 并 考察 其 4- 邻 域内 像素 的 标记 ， 由 
于 其 左边 像素 的 值 为 0， 因 此 赋予 像素 f/(4,0) 新 标记 B。 

4) 继续 扫描 ， 找 到 第 四 个 数值 为 1 的 像素 f(5,0) ， 并 考察 其 4- 邻 域内 像素 的 标记 ， 由 
于 其 左边 像素 的 值 为 0， 因 此 赋予 像素 f(5 ,0) 新 标记 B。 

5) 继续 扫描 ， 找 到 第 五 个 数值 为 1 的 像素 f(0,1) ， 并 考察 其 4- 邻 域内 像素 的 标记 ， 由 
于 其 上 边 像 素 的 值 为 0， 因 此 赋予 像素 f(0,1) 新 标记 C。 

6) 继续 扫描 ， 找 到 第 六 个 数值 为 1 的 像素 f(1，1)， 并 考察 其 4- 邻 域内 像素 的 标记 ， 由 
于 其 上 边 、 左 边 像 素 的 值 均 为 1， 且 标记 不 同 ， 因 此 赋予 像素 f(1,1) 标记 4， 同 时 得 到 4 和 
C 是 等 价 对 。 

7) 继续 扫描 ， 找 到 第 七 个 数值 为 1 的 像素 f(1,2) ， 并 考察 其 4- 邻 域内 像素 的 标记 ， 由 
于 其 上 边 、 左 边 像 素 的 值 均 为 1， 且 标记 均 为 4， 因 此 赋予 像素 f(1,2) 标记 4。 

8) 继续 扫描 ， 找 到 第 八 个 数值 为 1 的 像素 f(1,3) ， 并 考察 其 4- 邻 域内 像素 的 标记 ， 由 
于 其 上 边 像 素 的 值 为 0、 左 边 像 素 的 值 为 1， 因 此 赋予 像素 f(1,3) 标记 4。 

9) 继续 扫描 ， 找 到 第 九 个 数值 为 1 的 像素 f(1,5) ， 并 考察 其 4- 邻 域内 像素 的 标记 ， 由 
于 其 上 边 像 素 的 值 为 1、 左 边 像素 的 值 为 0， 因 此 赋予 像素 f(1,5) 标记 B。 以 次 类 推 ， 可 以 
完成 像素 f(5 ,2) 之 前 所 有 像素 的 扫描 ， 如 图 4. 42b 所 示 。 

10) 继续 扫描 ， 像 素 f(3,3) =1， 考 察 其 4- 邻 域内 像素 的 标记 ， 由 于 其 上 边 、 左 边 像素 
的 值 为 0， 因 此 赋予 像素 3 ,3) 标记 D， 如 图 4. 42c 所 示 。 

11) 继续 扫描 ,像素 /(4,3) =1， 考 察 其 4- 邻 域内 像素 的 标记 ， 由 于 其 上 边 、 左 边 像素 
的 值 均 为 1， 且 标记 不 同 ， 因 此 赋予 像素 f(4,3) 标记 4。 同 时 ， 标 记 4 和 DD 是 等 价 对 ， 如 图 
4. 42c 所 示 。 

12) 继续 扫描 ,像素 f(5,3) =1， 考 察 其 4- 邻 域内 像素 的 标记 ， 并 赋予 像素 f(5 ,3) 标 
记 五 ， 如 图 4. 42d 所 示 。 

13 ) 继续 扫描 ,像素 f(5,4) =1， 考 察 其 4- 邻 域内 像素 的 标记 ， 由 于 其 上 边 像 素 的 值 为 
1 且 标 记 为 ， 因 此 赋予 像素 f(5,4) 标记 天 ， 如 图 4. 42e 所 示 。 

14) 继续 扫描 ,像素 /(3,5) = 1 ， 考察 其 4- 邻 域内 像素 的 标记 ， 并 赋予 像素 /(3,5) 标 
记 下 ， 如 图 4. 42e 所 示 。 

15 ) 继续 扫描 ,像素 /(4,5) =1， 考 察 其 4- 邻 域内 像素 的 标记 ， 并 赋予 像 素 所 4,5) 标 
记 ， 如 图 4. 42f 所 示 。 

16) 继续 扫描 ,像素 1(5,5) =1， 考 察 其 4- 邻 域内 像素 的 标记 ， 并 赋予 像素 f(3,5) 标 
记 E， 如 图 4. 42f 所 示 ， 并 标记 E 和 是 等 价 对 。 

17) 全 部 像素 扫描 完毕 后 ， 将 相应 的 等 价 对 赋予 惟一 的 标记 ， 如 图 4. 42g 所 示 。 

需要 说 明 的 是 ， 在 标记 归并 过 程 中 ， 可 能 出 现 最 终结 果 中 标记 不 连续 的 现象 。 例 如 图 
4. 42h 中 , 仅 有 三 个 区 域 , 但 是 标记 却 为 | 4，B，E| 。 这 时 还 需要 对 最 终结 果 进 行 调整 ， 使 
标记 号 按 顺 序 排列 ， 例 如 |4，B，C}。 例 4.10 中 的 图 像 标 记 调整 后 的 最 终结 果 如 图 4. 42h 
所 示 。 

图 4. 43 给 出 了 8- 邻 域 连通 的 初始 检测 结果 、 等 价 对 合并 后 的 结果 及 最 终 的 检测 结 
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在 对 像素 f3 ,2) 进行 扫描 的 过 程 中 ， 可 以 发 现 标 记 4 和 标记 B 等 价 。 因 此 经 过 等 价 标记 的 
校正 后 ， 最 终 的 结果 如 图 4.43c 所 示 。 从 图 中 可 以 看 出 ， 整 个 图 像 经 过 8- 邻 域 顺序 扫描 后 ， 
得 到 两 个 区 域 。 






















































































01414101818 01414101414 01414101414 
4|1414141018 4|1414141014 4|1414141014 
4|1014101010 4|1014101010 4|1014101010 
0141410101C 0141410101C 01414101018 
0|101010101C 0|10|1010101C 0|1010101018 
010101CICIC 0I0OIOICICIC 0|1010181818 
a) 初始 扫描 结果 b) 等 价 对 归并 结果 c) 区 域 标记 调整 后 的 结果 





图 4.43 8- 邻 域 连通 顺序 扫描 结果 示意 




















4.5 区 域 生 长 法 











Hough 变换 适用 于 检测 已 知 形状 的 直线 与 曲线 。 但 是 大 多 数 区 域 分 割 都 是 非 规 则 的 形 
状 ， 这 时 可 以 采用 基于 区 域 特性 的 图 像 分 割 方法 ， 例 如 区 域 生长 法 、 区 域 合并 分 裂 法 等 。 

已 经 知道 ， 图 像 分 割 的 目的 就 是 把 一 幅 图 像 划 分 成 一 些 区 域 ， 每 个 区 域内 部 的 各 个 像素 
具有 相似 的 性 质 。 区 域 生 长 法 的 基本 思想 是 ， 把 图 像 分 割 成 若干 个 小 区 域 (极端 情况 下 是 每 
个 像素 ) ， 然 后 比较 相 邻 小 区 域 的 特征 相似 性 ， 若 相 邻 小 区 域 的 特征 足够 相似 ， 则 把 它们 聚 
集 起 来 形成 一 个 特定 的 区 域 ; 相似 小 区 域 不 断 合并 ， 直 到 不 能 继续 扩张 为 止 ;， 最 后 就 形成 了 
若干 个 特征 不 同 的 各 个 区 域 。 

区 域 生 长 法 也 称 为 区 域 扩张 法 ， 其 基本 步 又 可 以 如 下 描述 。 

1) 对 每 个 要 分 割 的 区 域 找 一 个 种 子 小 区 域 作 为 生长 起 点 。 

2) 考察 种 子 区 域 周围 的 小 区 域 (种 子 区 域 的 邻 域 )， 若 某 个 区 域 与 种 子 区域 具 有 相同 或 
相似 性 质 的 特征 (根据 某 种 事先 确定 的 生长 或 相似 准则 来 判断 ) ， 再 把 该 邻 域 合并 到 种 子 区 
域 所 在 的 区 域 中 。 

3) 将 获得 的 新 区 域 当做 新 的 种 子 区 域 继续 进行 2) 的 过 程 ， 直 到 没有 满足 条 件 的 像素 点 
时 停止 生长 。 

可 见 ， 为 了 实现 区 域 生 长 的 目标 ， 就 必须 确定 下 几 个 必要 的 参数 : 

1) 选择 合适 的 生长 种 子 点 ”选取 的 种 子 点 可 以 是 单个 像素 ， 也 可 以 是 包括 若干 个 像素 
的 子 区 域 ， 原 则 上 是 选取 具有 代表 性 的 点 。 

2) 确定 适当 的 特征 相似 性 度量 ” 即 选择 合适 的 特征 参数 描述 小 区 域 之 间 的 相似 性 。 大 
部 分 区 域 相似 性 准则 使 用 图 像 的 局 部 性 质 ， 如 灰 度 、 颜 色 、 纹 理 、 梯 度 等 。 

3) 生长 准则 ” 即 相似 到 什么 程度 的 小 区 域 或 像素 可 以 划分 为 同一 个 区 域 ,或 者 说 两 个 
小 区 域 或 像素 之 间 具 有 何 种 差异 可 以 认为 是 属于 不 同 的 区 域 。 生 长 准则 大 多 采用 的 是 与 种 子 
点 的 距离 度量 。 种 子 点 可 以 随 着 区 域 的 生长 而 变换 ， 也 可 以 设 定 为 一 个 固定 的 数值 。 

4) 区 域 生长 停止 的 条 件 ” 即 合适 种 子 点 停止 生长 。 一 般 情况 下 ， 区 域 生长 停止 条 件 是 
结合 生长 准则 来 进行 合理 的 设 定 。 判 定 生长 停止 的 阔 值 可 以 是 确定 的 值 ， 也 可 以 是 随 着 生长 
而 变化 的 值 。 
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根据 区 域 增长 所 采用 的 邻 域 ( 区 域 特点 ) 方 式 和 相似 性 准则 的 不 同 ， 可 以 把 区 域 生 长 法 
分 为 考察 像素 之 间 相 似 性 的 简单 区 域 增长 、 考 察 像素 与 小 区 域 之 间 相 似 性 的 质心 型 区 域 增长 
法 及 考察 区 域 与 区 域 之 间 相 似 性 的 混合 型 区 域 生长 法 。 

采用 区 域 生长 法 进行 区 域 分 割 的 具体 方法 总 是 与 相似 性 的 判别 准则 相对 应 的 。 下 面 介绍 
两 种 典型 的 、 基 于 灰 度 特性 相似 性 的 区 域 生长 方法 : 基于 灰 度 级 差 的 区 域 生 长 法 与 基于 灰 度 
分 布 相似 性 的 生长 方法 。 


4. 5.1 基于 像素 相似 性 的 简单 区 域 生长 法 


基于 像素 相似 性 的 区 域 生长 法 是 以 图 像 中 的 某 个 像素 为 生长 点 ， 比 较 相 邻 像素 的 特征 ， 
将 特征 相似 的 相 邻 像素 合并 为 同一 区 域 ， 然 后 以 合并 的 像素 为 生长 点 ,继续 合并 ， 最终 形成 
具有 相似 特征 的 像素 的 最 大 连通 集合 。 下 面 介 绍 一 种 基于 像素 灰 度 差 的 区 域 生长 法 。 

基于 像素 灰 度 差 的 区 域 生 长 方法 根据 相 邻 像素 之 间 的 灰 度 差 来 确定 像素 之 间 的 相似 性 ， 
如 果 它 们 的 灰 度 差 小 于 某 个 设 定 的 值 ， 则 认为 它们 属于 同一 区 域 。 假 设 (m，n) 为 当前 种 子 
像素 的 坐标 ，f(m，n) 为 其 灰 度 值 ， 其 区 域 标志 为 RCm,n) = 1 ,ff(i,j) 为 与 (m,n) 相 邻 的 、 
尚 不 属于 任何 区 域 的 像素 灰 度 值 ，7 为 预先 设 定 的 灰 度 差 闵 值 ，C 为 两 个 像素 之 间 的 灰 度 
差 ， 即 


























C =1 f(i,)) -mm)l (4.117) 
那么 基于 灰 度 差 的 简单 区 域 生 长 法 的 判别 式 可 以 表示 为 
如 果 C < 7, 则 RGi,j) = :7 (4. 118 ) 








也 就 是 说 ， 当 C <7， 说 明 两 个 像素 单元 (m,n) 和 (i, 站 相似 ， 两 者 属于 同一 个 区 域 ， 因 此 
应 该 合并 ; 当 C=7T 时 ,说 明 两 者 之 间 不 相似 ,像素 (i, 〗 仍 为 不 属于 任何 区 域 的 基本 单元 。 
基于 区 域 灰 度 差 的 生长 方法 的 主要 步骤 可 以 如 下 描述 : 

1) 对 图 像 进行 逐 行 扫描 ， 找 出 尚 没有 归属 的 像素 。 

2) 将 该 像素 周转 的、 不 属于 其 他 区 域 的 邻 域 像 素 (4- 邻 域 或 8- 邻 域 ) 逐个 与 之 比较 ， 如 
果 灰 度 值 差 小 于 预先 确定 的 靖 值 ， 将 它们 合并 。 

3) 以 新 合并 的 像素 为 中 心 ， 返 回 到 步骤 2) ， 检 查 新 像素 的 邻 域 ， 直 到 区 域 不 能 进一步 
扩张 为 止 。 

4) 返回 到 步骤 1) ， 继 续 扫描 直到 不 能 发 现 没 有 归属 的 像素 ， 则 结束 整个 生长 过 程 。 
显而易见 ， 上 述 方法 对 区 域 生 长 起 点 的 选择 有 较 大 依赖 性 。 

【 例 4.11】 简单 区 域 生长 法 的 图 像 分 制 示例 

图 4. 44a 所 示 为 原始 图 像 ， 假 设 阔 值 =5， 起 始 种 子 点 为 K0,0) = 16 ， 其 区 域 标志 
R(0,0) = 4 ， 考 察 其 8- 邻 域内 的 像素 ， 区 域 标记 为 4，B，C，… 

1) 以 第 一 个 像素 (0，0) 为 种 子 起 点 ,分 别 比 较 该 像素 与 其 邻 域 [f(1, 0)、f(0, 1) 与 
f(1，1) 三 个 像素 ] 的 灰 度 差 .， 并 根据 闵 值 判断 这 三 个 像素 的 区 域 标记 ， 有 

1f(1,0) -f(0,0) | =5 <7, 因此 R(1,0) =4 
1f(0,1) -f/f(0,0) | =4 <7, 因 此 R(1,0) = 4 
|f(1,1) -A(0,0)| = 112-16|=4<7, 因 此 R(1,0) =4 

检测 结果 如 图 4. 44b 所 示 。 

2) 分 别 以 新 检测 到 的 像素 为 中 心 ， 考察 每 个 像素 邻 域内 的 8 连通 像素 ， 即 f(2，0)、 
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f(2,0) -A(1,0) 
f(2,1) -A(1,0) 
f(2,2) -£1,1) 
f(1,2) -£1,1) 
f(0,2) -£0,1) 
检测 结果 如 图 4. 44c 所 示 。 





3) 以 新 合并 的 像素 为 中 心 ， 返 回 到 步 又 2 ) ， 












































10= 11 
14-11 
16 - 12 
13 - 14 
14 - 12 





图 4.44 ”区 域 增长 示例 
fA2, 1)、f(0, 2)、f(1, 2)、f(2,，2)， 并 判断 这 五 个 像素 是 否 属于 区 域 4， 有 


< 7, 因此 R(2,0) = 4 
< 了 7, 因此 R(1,2) =4 
< 了 7, 因此 R(2,2) =4 
< 了, 因此 R(1,2) =4 
< 7, 因此 R(2,0) = 4 


检查 新 像素 集合 的 邻 域 , 包括 (3，0)、 


(35. 1)% G35 2) (0 39, (1,.3)、 (2; 3)s (3 3)s 
|f(3,0) -=A2,1)|=16-14 < 了 ,因此 R3,0) = 4 
19 -14 > 了 , 因此 R(3,1) = 4 


|f(3,1) ~/(2,1) | 
|f(3,2) -1(2,2) | 


24 -16 > 7, 因此 R(3,2) 关 4 
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|f(0,3) -f(0,2)|=14-14 <7, 因 此 R(0,3)=A4 

|f(1,3) -=A0,2)|=17 -14 <7, 因 此 R(1,3) = 4 

|f(2,3) -f(2,2) | = 22 -16 > 7, 因此 R(2,3) 关 4 

|f(3,3) -f(2,3) | = 29 -16 > 7, 因此 R(3,3) 关 4 
结果 如 图 4. 44d 所 示 。 

4) 返回 步骤 2) ， 在 新 合并 的 像素 的 邻 域内 再 寻找 是 否 满足 要 求 的 像素 。 在 新 形成 区 域 
的 邻 域 像素 (4, 0) (3, 1) (3, 2)(3, 2)(4, 2)(4, 3) (0, 4)(1, 4) (2, 4) 内， 像素 (4， 
0)、(3, 2)、(2, 3)、(0, 4) 、(1, 4) 满 足 要 求 ( 见 图 4.44e)， 因 此 R(4, 0) =4,，R(3， 
2) =A, R(2, 3) =A, R(4, 0) =A, R(1, 4) =4。 

5) 返回 步骤 2) ， 继 续 寻 找 满足 要 求 的 像素 ， 像 素 (4，1) 和 (3，3 ) 满足 要 求 ， 如 图 
4. 44f 所 示 ， 即 

|f(3,1) - M(A) | = 19-14.1 < 了, 因此 R4,1) = 4,R(3,3) = 4 
M(A) = (16+11 +10+12+12+14+14+13+16+16+14+17+18+19)/14 


202 
= 一 一 = 14.4 
14 


6) 返回 步骤 2) ， 发 现 周围 没有 可 以 合并 的 像素 ， 因 此 区 域 4 不 在 增长 。 

7) 返回 到 步骤 1) ， 继 续 扫描 找到 没有 区 域 归 属 的 像素 (4，2) ， 并 赋予 区 域 标 记 民 (4， 
2) =B， 如 图 4. 44g 所 示 。 

8) 以 R(4,，2) =B 为 种 子 点 在 其 8 连通 邻 域内 寻找 是 否 有 满足 合并 要 求 的 且 没 有 区 域 
标记 的 像素 ， 可 以 发 现 像素 (4，3 ) 满足 灰 度 差 阔 值 要 求 ， 如 图 4. 44h 所 示 ， 即 

[|f(4,2) -KRK4,3) | = |40 -41| < 了 ,因此 R4,3) =B 

9) 在 新 合并 成 的 像素 (4，3 ) 的 邻 域内 (KF3,， 4) 、f(4，4) ) 继 续 扫描 找到 没有 区 域 归属 
的 像素 。 可 以 发 现 ， 它 们 都 符合 阅 值 要 求 ， 因 此 R(3,，4) =B，R(4, 4) = B。 检测 结果 如 
图 4.44i 所 示 。 

10) 同 理 ， 在 新 形成 的 区 域 B 的 邻 域内 继续 扫描 ， 发 现 f(3，2) 也 满足 区 域 有 的 阔 值 相 
似 性 ， 因 此 R(3,，2) =B。 

最 终 形成 的 结果 如 图 4. 44j 所 示 。 


4. 5.2 基于 像素 与 区 域 相似 性 的 质心 型 区 域 生长 法 


基于 像素 的 简单 区 域 生长 的 图 像 分 割 方法 原理 很 简单 ， 但 是 如 果 区 域 之 间 的 特征 变化 很 
缓慢 或 两 个 区 域 的 边缘 交 于 一 点 时 ， 两 个 区 域 就 会 合并 起 来 。 为 了 克服 这 一 缺点 ， 在 上 一 小 
节 的 主要 步骤 2) 中 不 是 比较 相 邻 像素 的 特征 值 ， 而 是 比较 已 存在 区 域 的 像素 特征 平均 值 与 
该 区 域 邻 接 的 像素 的 特征 值 。 这 种 算法 就 是 考察 像素 与 相 邻 区 域 相似 性 的 质心 型 区 域 生长 
法 。 下 面 仍 以 灰 度 值 作 为 区 域 特征 来 分 析 质 心 型 区 域 生 长 法 。 

假设 当前 小 区 域 有 N 个 像素 ， 其 区 域 标 号 均 为 !， 则 当前 区 域 的 平均 灰 度 值 为 


> film,n) 


mt (4.119) 


假设 (i, j) 为 该 小 区 域 的 一 个 相 邻 像素 ， 且 尚 不 属于 任何 区 域 ,7 为 预先 设 定 的 灰 度 差 
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阅 值 ，C 仍 为 小 区 域 与 f(i, 让 的 灰 度 差 ， 即 
C= |f(i,) -m(?) | (4. 120) 
那么 质心 型 区 域 生 长 法 的 判别 式 仍然 可 以 用 式 (4.70) 表 示 。 
基于 质心 型 的 区 域 生长 方法 的 主要 步骤 与 简单 区 域 生长 法 极为 类 似 ， 仅 是 增加 了 区 域 平 
均 灰 度 值 的 计算 ， 并 将 像素 之 间 的 相似 性 变 为 像素 与 区 域 之 间 的 相似 性 ， 因 此 其 基本 步骤 可 
以 描述 为 
1) 对 图 像 进行 逐 行 扫 描 ， 找 出 尚 没 有 归属 的 像素 。 
2) 以 该 像素 所 在 区 域 的 平均 灰 度 值 检 查 它 的 邻 域 像 素 ， 即 将 邻 域 中 的 像素 逐个 与 之 比 
较 ， 如 果 灰 度 值 差 小 于 预先 确定 的 阔 值 ， 将 它们 合并 。 
3) 按照 式 (4. 119) 计算 新 区 域 的 灰 度 平均 值 。 
4) 返回 到 步骤 2) ， 检 查 新 区 域 的 邻 域 ， 直 到 区 域 不 能 进一步 扩张 。 
5) 返回 到 步 又 1) ， 继 续 扫 撒 直 到 不 能 发 现 没 有 归属 的 像素 ， 则 结束 整个 生长 过 程 。 
【 例 4.12】 质心 型 区 域 生长 法 的 图 像 分 割 示例 
仍 以 图 4. 46a 给 出 的 图 像 数据 为 例 进行 区 域 分 隔 ， 其 他 初始 条 件 也 均 相 同 ， 效 值 仍 为 了 
=5， 起 始 种 子 点 为 K0，0) =16， 区 域 标志 R(0,， 0) =4， 考 察 相 似 性 时 仍然 考察 小 区 域 的 
8 连通 邻 域 ， 区 域 标 记 为 4，B，C，… 
1) 以 第 一 个 像素 的 0，0 ) 为 种 子 起 点 ， 分 别 比较 该 像素 与 其 邻 域 的 灰 度 差 ， 有 
1f(1,0) -f(0,0) | =5 <7, 因 此 R(1,0) = 4 
1f(0,1) -f(0,0) | =4 <7, 因 此 R(1,0) =4 
|f(1,1) -=f(0,0)| =12-16 =4<7, 因 此 R(1,0) =4 
检测 结果 如 图 4. 45b 所 示 。 
2) 计算 合并 后 的 区 域 平均 灰 度 值 
(16+11 +12+12) _51 
4 4 

















M(A) = = 12.75 





3) 以 A0, 0) 所 在 区 域 4 的 平均 灰 度 值 M(4) 检 查 它 的 邻 域 像素 。 此 时 小 区 域 中 有 四 个 
像素 ， 小 区 域 4 的 邻 域 中 没有 区 域 标记 的 像素 有 五 个 ， 即 f(2, 0), f(2, 1), f(0, 2)， 
f(1,，2), f(2，2)。 判 断 这 五 个 像素 是 否 属于 区 域 4， 有 

|f(2,0) ~- M(A) | = 12.75 -10 = 2.75 < 了 , 因此 R(2,0) = 4 
[1f(1,2) - M(A) | = 14 -12.75 < 了, 因此 R(1,2) =4 
|f(2,2) ~- M(A) | = 16 -12.75 <7, 因此 R(2,2) = 4 
|f(2,1) ~- M(A) | = 13 -12.75 <7, 因此 R(2,1) = 4 
|f(2,0) - M(A) | = 14 -12.75 < 了, 因此 R(2,0) =4 
检测 结果 如 图 4. 45c 所 示 。 
4) 新 合并 区 域 的 灰 度 值 为 
118 


M(A) = (16 +11 +10 +12+12+14+14+13+16)/9 = -0 =13.1 
5) 以 新 合并 的 像素 为 中 心 ， 返回 到 步骤 2)， 检 查 新 像素 集合 的 邻 域 , 包括 (3，0)、 


(3, 1)、(3, 2)、(0, 3)、(1, 3)、(2, 3)、(3, 3) 这 7 个 待考 察 的 像素 ， 有 
|f(3,0) - M(4) | =16 -13.1 <7, 因此 R(3,0) =4 
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四 百 可 加 
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m) n) 0) 


图 4.45 质心 型 区 域 增长 示例 
f(3,1) ~- M(A)| =19-13.1 > 7, 因此 R(3,1) 关 4 
f(3,2) ~- M(A) | = 24 - 13.1 , 因此 R(3,2) 关 4 
f(0,3) ~- M(A) | = 14 -13.1 ,因此 R(0,3) = 4 
f(1,3) ~- M(A) | = 17 -13.1 ,因此 R(1,3) = 4 
f(2,3) ~- M(A) | = 22 -13.1 , 因此 R(2,3) 关 4 








< 了 
< 了 
< 了 
> 了 
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[1f(3,3) - M(4) | = 29 -13.1 > 7, 因此 R(3,3) 关 4 
检测 结果 如 图 4. 45d 所 示 。 
6) 计算 新 区 域 4 的 平均 灰 度 值 ， 有 
M(A) =(16+11+10+12+12+14+14+13+16+16+14+17)Z12 
165 





= 3.73 
12 
7) 返回 步骤 2)， ne 的 邻 域内 再 寻找 是 否 满足 要 求 的 像素 。 在 新 形成 区 
域 的 邻 域 像素 (4, 0)、(3, 1)、(3, 2)、(3, 2)、(4, 2)、(4, 3)、(0, 4)、(1, 4)、 


(2, 4) 内 ， 只 有 像素 (0， a mn 即 
|f(0,4) - M(A) | = 18 -13.75 < 了, 因此 R(0,4) = 4 
检测 结果 如 图 4. 45e 所 示 。 
8) 计算 此 时 区 域 4 的 均值 ， 有 
M(A) = (16+11 +10+12+12+14+14+13+16+16+14+17+18)/13 
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二 3 二 14. 1 


9) 返回 步 又 2) ， 在 新 形成 的 区 域 4 的 邻 域内 继续 寻找 满足 要 求 的 像素 ， 只 有 像素 (3 ， 
1) 满足 要 求 ， 即 
|f(3,1) -MG4) | = 19 -14.1 < 了, 因此 R(3,1) = 4 
检 结 果 如 图 4. 45f 所 示 。 
10) 计算 区 域 4 的 灰 度 均值 ， 有 
M(A) = (16+11 +10+12+12+14+14+13+16+16+14+17+18+19)/14 
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二 < 三] 永 浊 
14 


11) 返回 步骤 2) 继 续 考 察 区 域 4 邻 域 内 的 各 个 像素 ， 发 现 没有 满足 灰 度 差 要 求 的 像素 ， 
因此 区 域 4 不 再 增长 。 

12) 返回 到 步骤 1) ， 继 续 扫描 找到 没有 区 域 归 属 的 像素 (4，0) ， 并 赋予 区 域 标 记 民 (4， 
0) =B， 如 图 4. 45g 所 示 。 

13) 以 R(4, 0) =B 为 种 子 点 在 其 8 连通 邻 域内 寻找 是 否 有 满足 合并 要 求 的 像素 。 由 于 
A{4，1) 的 邻 域内 仅 A(4，1) 没 有 区 域 标记 ， 因此 仅 句 计 算 该 像素 与 区 暨 卫 的 相似 外 有 

|f(4,1) -f(4,0) | = 26 -24 < 了 ,因此 R4,1) =B 

检测 结果 如 图 4. 45h 所 示 。 

14) 计算 新 区 域 B 的 平均 灰 度 值 ， 有 

50 


M(B) = (24 +26)/2 = 3 = 25 


15 ) 在 新 形成 的 区 域 B 的 邻 域内 继续 扫描 找到 没有 区 域 归 属 的 像素 ， 包括 f(3，2)、 
f(4，2) 两 个 像素 ， 有 
|f(3,2) - M(B) | = 25 - 24 < 7, 因此 R(3,2) =B 
|f(4,2) -~ M(B) | = 40 -25 > 7, 因此 R(4,2) 关 B 
检测 结果 如 图 4. 45i 所 示 。 
16) 计算 新 区 域 B 的 灰 度 平均 值 ， 有 
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74 
M(B) = (24 +26 +24)/3 = = 24.7 


17) 同 理 ， 在 新 形成 的 区 域 B 的 邻 域内 [包括 f(2,，3)、f(3,，3) 和 f/(4，3)] 继 续 扫 描 ， 
直到 区 域 B 不 再 增长 ， 其 结果 如 图 4.45j 所 示 。 

18) 以 像素 f(4，2) 为 新 的 种 子 点 ， 并 赋予 其 区 域 标记 R(4，2) =C， 如 图 4.45k 所 示 。 

19) 返回 步骤 2) ， 继 续 进 行 区 域 C 的 增长 ， 可 以 发 现 f(4，3 ) 满 足 与 区 域 C 的 灰 度 差 要 
求 , 因此 R(4, 3) =C， 检 测 结 果 如 图 4. 451 所 示 。 

20) 计算 新 区 域 C 的 灰 度 均值 ， 有 

M(C) = (40 + 41)/2 = 40.5 

21) 返回 步骤 2) ， 考 察 区 域 C 的 邻 域 像素 f(3,，4) 和 了 (4，4)， 发 现 两 者 皆 满 足 与 区 域 
C 的 灰 度 差 要求 ， 因 此 R(3,，4) =C，R(4, 4) =C。 检测 结果 如 图 4.45m 所 示 。 

22) 计算 区 域 C 的 灰 度 均值 ， 有 

M(C) = (40 +41 +37 +38)/4 = 39 

23) 返回 步骤 2)， 考 察 区 域 C 的 邻 域 像素 f(2，4) ， 发 现 该 像素 满足 与 区 域 C 的 灰 度 差 

要 求 ， 因 此 R(2, 4) =C。 检 测 结果 如 图 4. 45n 所 示 。 


4. 5.3 混合 型 区 域 增长 


混合 型 区 域 增长 把 图 像 分 成 若干 个 小 区 域 ， 比 较 各 个 小 区 域 的 相似 性 ， 相 似 则 合并 。 考 
察 区 域 之 间 相 似 性 的 方法 有 多 种 ， 例 如 基于 灰 度 差 的 区 域 增长 法 、 基 于 灰 度 分 布 的 区 域 增长 
法 等 。 由 于 基于 灰 度 分 布 的 区 域 增长 法 的 性 能 较 好 ， 下 面 就 简单 介绍 其 基本 步 又 。 

(1) 首先 把 图 像 分 成 互 不 重生 的 若干 个 小 区 域 

(2) 比较 相 邻 小 区 域 的 累积 灰 度 直方 图 ， 根 据 灰 度 分 布 的 相似 性 进行 区 域 合 并 

常用 的 相似 性 判断 标准 有 如 下 两 种 方法 : 

1 ) Kolmogorov-Smirnov 检测 ， 有 








max |hi(z) —h,(z) | (4.121) 
2) Smoothed-Difference 检测 ， 有 
> |h(z) -hlz) | (4. 122) 


式 中 ,hh (z) 和 hh,(z) 分 别 为 两 相 邻 小 区 域 的 累积 灰 度 直方 图 。 

(3) 通过 反复 进行 步骤 (2) 中 的 操作 ， 直 到 各 区 域 不 能 增长 为 目 

在 利用 区 域内 灰 度 分 布 统 计 特性 对 图 像 进行 分 割 时 ， 小 区 域 尺 寸 n 的 设 定 对 最 终 分 割 结 
果 可 能 有 较 大 影响 。 尺 寸 n 太 小 时 ， 检 测 可 靠 性 降低 ; 尺寸 n 太 大 时 ,得 到 的 区 域 形 状 不 理 
想 ， 可 能 漏 掉 小 的 目标 。 实 际 中 ,nn 取 值 范围 一 般 为 5 ~ 10。 此 外 ， 对 于 式 (4. 121) 和 式 
(4. 122 ) 的 两 种 相似 性 判决 规则 ， 由 于 Smoothed-Difference 检测 标准 考虑 了 所 有 灰 度 值 分 布 ， 
因此 比 Kolmogorov-Smirorv 检测 要 严格 ， 其 检测 效果 也 要 好 些 。 


4.S.4 基于 区 域 形 状 的 区 域 增长 


除了 利用 区 域 灰 度 差 和 区 域 灰 度 统计 特性 考察 区 域 的 相似 性 外 ， 还 可 以 利用 区 域 形 状 进 
行 相似 性 的 考察 ， 常 用 两 种 方法 : 
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1) 把 图 像 分 割 成 灰 度 固定 区 域 ， 设 两 相 邻 区 域 的 周 长 分 别 为 P 和 P,， 把 两 区 域 共同 边 
界 两 侧 灰 度 差 小 于 给 定 值 的 那 部 分 长 度 设 为 工 ， 如 果 上 述 三 个 参数 满足 如 下 条 件 : 
L 
min| P,P,|! 





> 7 (4. 123) 


则 把 两 个 区 域 进行 合并 。 
2) 把 图 像 分 割 成 灰 度 固定 的 区 域 , 设 两 相 邻 区 域 的 共同 边界 长 度 为 ， 把 两 区 域 共同 
边界 线 两 侧 灰 度 差 小 于 给 定 值 的 那 部 分 长 度 设 为 L， 如 果 上 述 三 个 参数 满足 如 下 条 件 : 


> 也 (4. 124) 





则 把 两 个 区 域 进行 合并 。 

上 述 两 种 方法 的 区 别 是 ， 第 一 种 方法 是 合并 两 邻接 区 域 的 共同 边界 中 对 比 度 较 低 部 分 占 
整个 区 域 边界 份额 较 大 的 区 域 ， 而 第 二 种 方法 是 合并 两 邻接 区 域 的 共同 边界 中 对 比 度 较 低 部 
分 比较 多 的 区 域 。 


4.6 ”区域 分 裂 -合并 方法 


区 域 生长 过 程 是 从 一 组 生长 点 开始 ， 通 过 不 断 合并 新 区 域 或 像素 来 完成 整个 分 割 过 程 。 
与 此 相反 ， 区 域 分 裂 与 合并 法 的 基本 原理 是 ， 首 先 将 图 像 分 割 成 若干 个 任意 不 相交 的 区 域 ， 
然后 计算 每 个 子 区 域 的 属性 。 当 属性 表明 该 区 域 包 含 不 同属 性 的 像素 时 ， 则 将 该 区 域 再 分 割 
成 若干 个 子 块 ; 如 果 几 个 子 区 域 的 属性 相似 ， 则 把 他 们 合并 成 一 个 大 的 区 域 。 

在 众多 基于 区 域 分 裂 与 合并 的 图 像 分 割 算法 中 ， 基 于 四 又 树 的 方法 是 最 常用 的 一 种 方 
法 。 其 基本 思想 是 ， 把 原始 图 像 作 为 树 根 或 零 层 ， 将 该 图 像 分 成 4 个 子 块 ， 作 为 被 分 裂 的 第 
一 层 。 对 第 一 层 的 每 个 子 块 ， 若 像素 属性 极其 相似 或 一 致 ， 则 该 子 块 不 再 等 分 ;如 果 某 个 子 
块 的 像素 属性 不 一 致 或 相差 较 大 ， 则 该 子 块 必须 分 裂 成 相等 的 4 个 更 小 的 子 块 作为 第 二 层 ， 
依次 循环 直到 所 有 的 子 块 都 不 能 再 分 裂 为 止 。 此 外 ， 在 每 层 分 裂 的 过 程 中 ， 如 果 在 不 需要 分 
裂 的 几 个 子 块 中 ， 有 几 个 子 块 的 性 质 相 似 或 一 致 ， 则 将 这 些 子 块 合并 。 最 后 ， 再 次 考察 各 层 
子 块 之 间 的 关系 ， 把 相似 性 大 的 子 块 进行 合并 。 

下 面 以 一 个 图 4. 46 所 示例 子 来 说 明 区 域 分 裂 -合并 法 的 基本 步骤 。 

1) 首先 ， 将 原 图 分 类 成 图 4. 46a 所 示 的 4 个 子 块 : RI、R,、R; 和 民 。 计 算 这 些 区 域 的 
属性 值 ， 例 如 图 像 子 区 域 的 灰 度 均值 与 方差 。 

CD 


a) 第 一 次 分 裂 b) 第 二 次 分 裂 0) 对 应 的 四 叉 树 

























































































图 4.46 区 域 分 裂 -合并 法 的 基本 步骤 
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2) 如 采 某 个 子 区 域 的 属性 值 超出 设 定 的 阐 值 ， 则 对 该 子 块 进行 分 裂 。 例 如 ,假设 区 域 
RR 的 方差 大 于 设 定 的 方差 闵 值 ， 则 表明 该 子 块 包含 多 个 区 域 的 内 容 ， 则 对 R, 进行 分 裂 ， 如 


图 4.46b 所 示 。 








3) 如 果 录 个 区 域 的 属性 值 在 设 定 的 国 值 内 ， 如 方差 小 于 设 定 的 阔 值 ， 则 表明 该 子 区 域 


的 像素 具有 一 致 性 ， 不 再 分 裂 。 
4) 对 当前 判断 为 不 需要 分 裂 的 子 块 
灰 度 均值 相似 ， 则 将 两 个 子 块 进行 合并 。 


5) 重复 上 述 过 程 ， 直 到 没有 可 合并 、 分 裂 的 区 域 为 止 。 











属性 进行 对 比 ， 如 果 相 邻 子 块 的 


图 4. 46c 给 出 了 上 述 算法 的 四 又 树 数 据 结构 。 
【 例 4.13】 区 域 分 裂 与 合并 方法 示意 
假设 原 图 如 图 4. 47a 所 示 ， 子 区 域 分 裂 的 方差 阔 值 为 rw =2， 合 并 的 灰 度 差 阔 值 为 wn 


= 
1) 首先 ， 将 原始 图 像 分 裂 成 4 个 
区 域 ， 如 图 4. 47b 所 示 。 分 别 计算 每 一 
个 子 区 域 的 灰 度 均值 与 方差 ， 有 
由 = 11.75,0, = 1.71 
MW = 22.5,0, = 4.35 
Ws = 13.5,0, = 1.73 
Ws = 31.75,0, = 10.14 
2) 根据 o 的 值 判断 4 个 子 区 域 是 
否 需要 进一步 分 裂 。 根 据 每 个 区 域 的 方 
差 值 可 知 ， 区 域 R 和 R, 满足 方差 相似 
性 条 件 ， 不 需要 进行 分 裂 ; R, 和 尺 则 
不 满足 方差 相似 性 条 件 ， 需 要 进行 进 一 
步 分 型 。 具 体 情况 如 图 4. 47c 所 示 。 
3) 根据 灰 度 均值 闵 值 进行 合并 ， 
可 见 区 域 尺 、RsR 分 裂 后 的 子 区 域 R， 
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0) 继续 分 裂 


























属性 值 相似 ， 例 如 





b) 4 个 子 块 


"< 国 
|" 回国 


区 国 
-= 民国 


d) 最 终结 果 











图 4.47 


区 域 分 裂 与 合并 方法 示意 





可 以 进行 合并 ，R,, 、R;; 、R,s 、R4 和 Rs 可 以 进行 合并 ， 而 R,、Ry 可 以 进行 
由 于 RR 和 RR 已 经 分 裂 到 最 小 单位 ， 为 单个 像素 ， 因 此 不 再 进行 分 裂 。 


4. 47d 所 示 。 


第 5 和 摄像 机 标定 





空间 某 点 的 三 维 几 何 位 置 坐标 与 其 在 图 像 中 对 应 点 之 间 的 相互 关系 是 由 摄像 机 成 像 几 何 
模型 决定 的 ， 这 些 几 何 模型 参数 就 是 摄像 机 参数 。 多 数 情况 下 ， 这 些 参数 必须 通过 实验 与 计 
算 才 能 得 到 ， 这 个 过 程 称 为 摄像 机 的 标定 。 标 定 过 程 就 是 确定 摄像 机 的 几何 和 光学 参数 及 摄 
像 机 相对 于 世界 坐标 系 的 方位 的 过 程 。 

摄像 机 参数 总 是 相对 于 某 种 几何 成 像 模 型 的 ， 这 个 模型 是 对 光学 成 像 过 程 的 简化 。 如 针 
孔 成 像 模型 ， 它 是 摄像 机 标定 研究 的 基本 模型 。 

然而 在 很 多 情况 下 ， 这 种 线性 模型 不 能 准确 描述 摄像 机 成 像 的 几何 关系 ， 如 在 近 距 、 广 
角 时 的 情形 。 因 此 ， 还 需 考 虑 线性 或 非 线性 的 畸变 误差 补偿 后 ， 才 能 更 合理 地 看 作 针 孔 模 型 
的 成 像 过 程 ， 利 用 校正 后 的 模型 进行 三 维 重建 才能 得 到 更 高 的 精度 ， 因 此 成 像 模 型 和 畸变 误 
差 补 偿 成 为 视觉 中 摄像 机 标定 研究 的 重要 内 容 。 

摄像 机 标定 的 基本 方法 是 ， 在 一 定 的 摄像 机 模型 下 ， 基 于 特定 的 实验 条 件 如 形状 、 尺 十 
已 知 的 标定 参照 物 ， 经 过 对 其 进行 图 像 处 理 ， 利 用 一 系列 数学 变换 和 计算 方法 ， 求 取 摄 像 机 
模型 的 内 部 参数 和 外 部 参数 。 

摄像 机 标定 一 般 分 为 经 典 标定 方法 和 自 标定 方法 。 经 典 的 摄像 机 标定 技术 利用 已 知 物体 
上 的 一 些 点 的 三 维 坐 标 和 它们 相应 的 图 像 点 坐标 ， 计 算 摄像 机 的 内 外 参数 。 当 前 对 传统 摄像 
机 标定 技术 的 研究 集中 在 非 线 性 畸变 校正 。 经 典 标定 方法 具有 标定 精度 高 、 可 以 使 用 任意 摄 
像 机 模型 的 优点 ， 其 不 足 之 处 在 于 标定 过 程 复杂 ， 需 要 高 精度 的 标定 抉 或 标定 框架 。 在 应 用 
场合 要 求 较 高 且 摄 像 机 参数 不 经 常 变化 时 ，_ 般 采用 此 类 方法 。 自 标定 方法 不 依赖 于 标定 参 
照 物 ， 仅 利用 摄像 机 在 运动 过 程 中 周围 环境 的 图 像 与 图 像 之 间 的 对 应 关系 对 摄像 机 进行 标 
定 。 自 标定 方法 包括 基于 主动 视觉 的 摄像 机 自 标定 技术 (基于 平移 运动 的 自 标定 技术 和 基于 
旋转 运动 的 自 标定 技术 ) 、 利 用 本 质 和 矩阵 和 基 
本 和 矩 阵 的 自 标定 技术 、 利 用 多 幅 图 像 之 间 直 
线 对 应 关系 的 摄像 机 自 标 定 等 。 自 标定 方法 
非常 灵活 ， 但 标定 过 程 复杂 ， 重 棒 性 不 足 。 
不 宜 用 于 实时 性 要 求 较 高 的 场合 ， 主 要 应 用 
于 精度 要 求 不 高 的 场合 ， 如 虚拟 现实 等 。 目 
前 ， 的 
的 视觉 测量 技术 已 经 成 为 国内 外 视觉 测量 领 
域 中 的 研究 热点 。 摄 像 机 标定 系统 如 图 5. 1 图 5.1 摄像 机 标定 系统 
所 示 ， 经 典 标定 车 标 的 控制 点 类 型 如 图 5. 2 所 示 。 


OO 口 口 2 口 昌 
| 




































































153 


5.1 摄像 机 模型 


5.1.1 坐标 变换 

常用 的 坐标 变换 包括 平移 、 旋 转 、 尺 度 变换 等 。 坐 标 变换 包含 两 个 方面 的 含义 : 坐标 系 
不 变 而 原 坐 标点 坐标 变换 ， 原 坐标 点 不 变 而 坐标 系 发 生变 换 。 

1. 平移 变换 

(1) 用 平移 量 (X，，Y,，2, ) 将 具有 坐标 为 (X，y，2Z) 的 点 平移 到 新 的 位 置 

这 种 平移 变换 可 用 如 下 三 个 等 式 完成 : 





和 = 和 和 
Y=Y+% (5.1) 
Pay A 
矩阵 形式 为 
1 [1 0 0 天 |X 
Y=lo 1 0 % (5.2) 
wo 











一 般 来 说 ， 坐 标 变换 常 将 几 个 变换 级 连 起 来 产生 组 合 的 结果 ， 如 平移 后 加 上 旋转 等 。 式 
(5.2) 中 的 变换 和 矩阵 不 是 方 阵 ， 运 算 起 来 比较 麻烦 ， 因 此 采用 齐 次 坐标 的 形式 等 价 写 为 
XxX] [1 0 0 Xx 





7Y| lo1o0 yy 








= (5.3) 
Z| |I00 1 ZZ 
1」 lo000 1]1 
采用 统一 的 矩阵 表达 形式 ， 即 
c, = TW (5.4) 
T 是 4 x4 变换 矩阵 ，W 是 包含 原 坐 标的 矢量 ， 即 
W,=[X Y 2Z 1] 
cs, 是 变换 后 坐标 组 成 的 矢量 ， 即 
c,=[X’” Y 2 1] 
平移 矩阵 可 以 写成 
1 0 0 蕊 
0 1 .0077 
T= (5.5) 
0 0 1 2 
0 0 1 





0 
(2) 将 原 坐 标 系 原点 移 至 (X,，Y,，2Z。) ， 得 到 相应 的 点 在 新 坐标 系 中 的 平移 坐标 
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X' =X-X, 

Y=Y-Y, 

Z'=Z -Zo 
相应 的 变换 矩阵 为 

1 0 0 -xX 

天 0 1 0 -7 

0 0 1 -2 

000 1 
和 矩阵 表达 形式 为 

cu = 了 全， 


2. 尺度 放 缩 变换 


S,、5,、S, 沿革 、Y、Z 轴 进 行 缩放 变换 可 用 如 下 变换 矩阵 来 实现 : 


3. 旋转 变换 

(1) 坐 标 系 中 的 点 绕 坐 标 轴 转 动 

如 图 5.3 所 示 ， 坐 标 系 中 的 某 点 绕 某 
一 坐标 轴 旋 转 ， 旋 转角 是 按 从 旋转 轴 正 向 
看 原点 而 顺 时 针 方 向 定义 的 。 设 坐标 系 内 
一 点 4 绕 Z 轴 顺 时 针 旋 转 y 角度 。 由 4 点 
转 至 4A’ 点 。 则 有 





Xn cosy siny 0X 

Yr |=| -siny cosy 0|1 六 

Zi 0 0 1jJLZ, 
(5.10) 


同 理 ， 将 一 点 绕 民 轴 转 a 角度 ， 可 用 
如 下 变换 矩阵 实现 : 


0 





0 
S, 
0 


i ee 





(5.6) 


(5.7) 


(5.8) 


(5.9) 











0 0 
COSQ SInQL 
一 SinQ cosa 
0 0 
0 0 
COSQL SinQ 
一 SinQ cosa 


将 一 点 绕 了 轴 转 B 角度 ， 可 用 如 下 变换 矩阵 实现 : 


i 





坐标 轴 转 动 





人 


(5.11) 


(5. 12) 
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cosB 0 sn8 0 
0 1 
Rs = (5. 13 ) 
—sinB 0 cosB 0 
0 0 0 1 
或 
cosB 0 sinB 
Rs=| 0 1 0 (5. 14) 
—sinB 0 cosB 
将 一 点 绕 Z 轴 转 y 角度 ， 可 用 如 下 变换 矩阵 实现 : 
cosy siny 0 0 
-Siny cosy 0 0 
R, = (5.15) 
0 0 1 0 
0 0 -1 
或 
cosy siny 0 I 
Z 
R,=| -siny cosy 0 (5.16) i 
Al 
0 QO 
(2) 坐标 系 绕 某 一 坐标 轴 转 动 
设 原 坐标 系 为 0 -XYZ， 坐 标 系 绕 Z 轴 
顺 时 针 旋 转 y 角度 ， 新 坐标 系 为 0 -成 也。 
坐标 系 内 一 点 4 不 动 ， 求 4 点 在 新 坐标 系 0 > 
-YZ 的 坐标 。 如 图 5.4 所 示 ,， 设 0B = 
R， 则 有 
Ys = Reosa 
(了 
Xp = ReosB 是 
则 图 5.4 ”坐标 系 绕 坐 标 轴 旋 转 
X,, = Reos(B+Y) 
Day (5. 18) 
Y», = Reos(Q —7y) 
则 
Xp =Reos(B+Yy) =R(cosBcosy - sinBsiny) =Xpcosy — Yssiny (5.19) 
Yy, =Reos(@a -7Y) = 民 (cosacosy + Sinasiny ) = Ypcosy + Xpsiny 
写成 矩阵 形式 为 
Xp cosy -siny 0] Xs 
Ys |=| siny cosy 0| 区 (5. 20) 


2 0 0 1 
同 理 将 坐标 系 绕 XX 轴 转 a 角度 ， 可 用 如 下 旋转 变换 矩阵 实现 : 
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] 0 0 0 
R= 0 —sing 0 (5.21) 
0 sing cosa 0 
0 0 0 1 
或 
1 0 
R,=|0 cosa La (5. 22 ) 
0 Sina cosa 
将 坐标 系 绕 了 轴 转 B 角度 ， 可 用 如 下 旋转 变换 矩阵 实现 : 
cosB 0 -sinB 0 
Rs = 2 . 9 (5. 23) 
sinB 0 cosB 0 
0 0 0 1 
或 
cosB 0 -sinB 
Rs=| 0 1 0 (5S, 24) 
sinB 0 cosB 
将 坐标 系 绕 Z 轴 转 yy 角度 ， 可 用 如 下 旋转 变换 矩阵 实现 : 
cosy -siny 0 0 
siny cosy 0 0 
7 0 0 [i (5. 25) 
0 0 0 1 
或 
cosy -siny 0 
R,=| siny cosy , (5. 26) 
0 0 1 





4. 级 连 
连续 多 个 变换 可 用 一 个 4x4 的 变换 矩阵 表示 。 例 如 ， 对 一 个 坐标 矩阵 为 W, 的 点 的 平 
移 、 放 缩 、 绕 Z 旋转 变换 可 表示 为 
c =R,[ S(TW,)] =AW, (5. 27) 
式 中 , 4 是 一 个 4 x4 的 矩阵 ，4 = R,ST。 这 些 矩 阵 的 运算 次 序 一 般 不 可 互 换 。 
5. 反 变 换 
上 面 许多 变换 都 有 执行 反 变换 的 逆 和 矩阵 ， 如 平移 的 逆 抢 阵 为 





1 0 0 -总 
010 -% 
ca . (5. 28) 
eo0 
0 0 0 1 


相似 地 ， 旋 转 的 逆 矩 阵 为 
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cos( -7y) sin(-y) 0 0 
-Sin( 一 一 0 0 

R-! = - y) y) ee (5. 29) 
0 1 


0 0 
5.1.2 成 像 变 换 


最 常见 的 成 像 变 换 是 几何 透视 变换 ， 其 特点 是 随 着 三 维 (3D) 场 景 与 摄像 机 之 间距 离 的 
变化 ， 像 平面 上 的 投影 也 发 生变 化 。 

1. 成 像 坐 标 系 统 

为 了 描述 空间 一 点 与 其 在 像 平 面 上 的 投影 之 间 的 相互 关系 ， 即 阐述 摄像 机 模型 和 摄像 机 
标定 方法 ， 需 定义 相关 坐标 系 。 以 摄像 机 成 像 系 统 定义 如 下 坐标 系 。 

(1) 世界 坐标 系 

它 也 称 真实 或 现实 世界 坐标 系统 XYZ， 它 是 客观 世界 的 绝对 坐标 系 ， 也 是 物 方 坐标 系 。 
一 般 三 维 场景 都 用 这 个 坐标 系 来 表示 。 

(2) 摄 像 机 坐标 系统 

它 是 以 摄像 机 为 中 心 制定 的 坐标 系统 ， 即 wyz。 一 般 常 取 摄 像 机 光学 中 心 为 原点 ， 摄 像 
机 光学 轴 为 z 轴 。 

(3 ) 像 平面 坐标 系统 

在 摄像 机 内 所 形成 的 像 平面 坐标 系统 x'y'。 一 般 常 取 像 平面 与 摄像 机 坐标 系 的 xy 平面 
平行 ， 且 与 x 轴 与 x' 轴 , y 与 y' 轴 分 别 重 合 。 这 样 像 平面 原点 就 在 摄像 机 的 光学 轴 上 。 

(4) 计 算 机 图 像 坐标 系统 

计算 机 内 部 数字 图 像 所 用 的 坐标 系统 MYV。 数 字 图 像 最 终 由 计算 机 内 部 的 存储 器 保存 ， 
所 以 要 将 像 平 面 的 投影 坐标 转换 到 计算 机 图 像 坐标 系统 中 。 

2. 小 孔 成 像 模型 

三 维 空间 中 物体 到 像 平 面 的 投影 关系 即 为 成 像 模 型 ， 如 图 5.5 所 示 ， 采 用 透镜 成 像 描述 
摄像 机 成 像 原 理 ， 设 物 距 为 w， 透 镜 焦 距 为 f/， 像 距 为 ,根据 几何 光学 的 高 斯 成 像 定 理 ， 物 
距 ww、 焦 距 和 像 距 v 三 者 之 间 满 足 如 下 关系 : 

1 1 1 


一 -二 一 -十 


f wu 7 














(5. 30) 














了 





图 5.5 透镜 成 像 原理 


一 般 情况 下 ，uw >> 族 所 以 v=/， 即 像 距 与 焦距 相近 。 在 实际 应 用 中 ， 小 孔 成 像 模型 是 计算 
机 视觉 中 广泛 采用 的 理想 的 投影 成 像 模型 ， 也 称 针 孔 模型 。 假 设 摄像 机 理想 成 像 ， 不 存在 非 
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线性 畸变 ， 如 图 5.6 所 示 。 物 体 表 面 的 反射 光线 都 经 过 一 个 小 孔 而 投影 到 像 平面 上 ， 满 足 光 
的 直线 传播 条 件 。 景 物 点 、 针 孔 、 景 物 点 成 的 像 在 一 条 直线 上 ， 就 像 光线 经 过 光学 中 心 的 一 
个 小 孔 一 样 ， 故 称 小 孔 成 像 模型 。 景 物 点 与 针 孔 的 连 线 与 像 平 面 的 交点 即 为 成 像 点 。 为 方便 
起 见 ， 通 常 认为 图 像 平 面 在 针 孔 前 面 ， 即 虚拟 图 像 的 位 置 。 针 孔 模 型 主要 由 光 心 、 成 像 面 和 
光 轴 组 成 。 


















区 
! 一 ”虚拟 图 像 
虚拟 成 像 平 面 


| 
| 
成 像 平面 1 一 


图 5.6 小 孔 成 像 模型 
5.1.3 ”摄像 机 的 镜头 晨 变 


实验 表明 ， 描 述 摄像 机 成 像 的 线性 模型 在 很 多 情况 下 不 能 准确 描述 成 像 的 几何 关系 ， 尤 
其 在 使 用 广角 镜头 时 ， 远 离 图 像 中 心 处 会 有 较 大 的 畸变 。 

1. 光学 畸变 一 般 概念 

如 图 5.7 所 示 ， 由 于 摄像 机 物镜 系统 设计 、 制 作 、 装 配 所 引起 的 像 点 偏离 其 理想 位 置 的 
点 位 误差 称 为 光学 畸变 。 光 学 畸变 可 划分 为 径 向 畸变 和 偏心 畸变 两 种 类 型 ， 如 图 5.8 所 示 。 
径 向 畸变 使 像 点 治 径 向 方向 偏离 其 标准 理想 位 置 ; 偏心 畸变 使 像 点 沿 径 向 方向 和 垂直 径 向 方 
向 ， 相 对 其 理想 位 置 都 发 生 偏离 ， 径 向 方向 的 畸变 称 为 非 对 称 径 向 畸变 ， 垂 直径 向 方向 的 畸 
变 称 为 切身 畸变。 






































图 5.7 光学 畸变 





测量 涉及 的 主要 像 差 ， 高 精度 测量 时 ， 进 行 摄像 机 标定 必须 考虑 镜 
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头 畸变 。 主 要 畸变 误差 分 为 三 类 : 径 向 畸变 、 偏 心 畸 变 和 薄 校 镜 畸 变 。 第 一 类 畸变 只 产生 径 
癌 位 置 的 偏差 。 后 两 类 则 既 产 生 径 癌 偏 差 ， 又 产生 切 向 偏差 。 
(1) 径 向 畸变 
径 向 畸变 主要 由 镜头 形状 引起 的 ， 关 于 摄像 机 镜头 的 主 光 轴 对 称 。 正 向 畸变 称 为 枕 形 畸 
变 ， 负 向 畸变 称 为 桶 形 畸 变 ， 如 图 5.9 所 示 。 其 数学 模型 为 
A =x[h (x +y ) +h (x +y ) ] 
A, =y[h (x +y) +h (x +y )"] 
式 中 ，k, 入 为 径 问 畸变 系数 。 














(5. 31) 


一 一 


实际 像 
点 位 置 





| 





dr: 径 向 畸变 / 
dt: 切 向 畸变 





网 $.9 畸变 产生 的 效果 








图 5.8 理想 像 点 与 实际 像 点 位 置 关系 























1 一 桶 形 畸 变 2 一 枕 形 畸变 





(2) 偏心 畸变 
偏心 畸变 主要 由 光学 系统 光 心 与 几何 中 心 不 一 致 造成 的 ， 即 镜头 器 件 的 光学 中 心 不 能 
格 共 线 。 这 类 畸变 既 含有 径 向 畸变 ， 又 含有 切线 畸变 。 其 数学 模型 为 


1 2 1 (5. 32) 
4 =2p1xy +ps (x +37 ) 


式 中 ，p, 和 pp, 为 俩 心 畸 变 系数 。 
(3 ) 薄 棱 镜 畸 变 
薄 棱 镜 畸 变 是 由 于 镜头 设计 缺陷 和 加 工 安装 误差 所 造成 的 ， 如 镜头 与 摄像 机 像 面 有 很 小 
的 倾角 等 。 这 类 畸变 相当 于 在 光学 系统 中 附加 了 一 个 蒲 棱镜 ， 不 仅 会 引起 径 向 偏差 ， 而 且 引 
起 切 向 偏差 。 其 数学 模型 为 
A =s1(x +y ) 


en (5. 33) 
A,, =s,(% 十 和 ) 
式 中 ，s, 和 。 为 薄 棱 镜 畸 变 系数 。 
综合 上 述 各 类 畸变 模型 ， 则 镜头 畸变 可 以 用 如 下 模型 表示 
A (x =A A, (x A (x 
(x, 7) =As(x, 7) +Aa(x, y) +As(x, y) (5. 34) 


A,(x, y) =A,, (x, y) + A (x, y) +A,(x, y) 
一 般 来 说 径 向 畸变 已 经 足够 描述 非 线 性 畸变 。 如 果 考 虑 镜头 畸变 ,需要 对 小 孔 成 像 模型 
进行 修正 ， 实 际 像素 坐标 (x” ，y" ) ， 理 想像 素 坐 标 (x'，y') 和 畸变 偏差 之 间 可 写 为 
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5. 1.4 “摄像 机 模型 


摄像 机 模型 即 描述 空间 点 与 其 成 像 点 之 间 关 系 的 公式 。 根 据 所 定义 的 世界 坐标 系 、 摄 像 
机 坐标 系 等 几 个 坐标 系 之 间 的 相互 关系 不 同 ， 可 以 得 到 不 同 的 摄像 机 成 像 几何 模型 。 

1. 世界 坐标 与 摄像 机 坐标 重合 时 的 摄像 机 模型 

(1) 投 影 变 换 

如 图 5. 10 所 示 ， 应 用 小 孔 成 像 模型 ， 图 像 中 摄像 机 坐标 系统 的 xy 平面 与 像 平面 重合 ， 
光学 轴 沿 z 轴 。 这 样 像 平 面 的 中 心 处 于 原点 ， 镜 头 光学 中 心 的 坐标 是 (0，0， 了) , /是 镜头 的 
焦距 。 假 设 摄像 机 坐标 系统 与 世界 坐标 系统 XYZ 平行 。 


2 








WX,Y,2) 


Cx.y,2) (0,0,7) 





Lx"y') 





, 
,0,07 Lpy 


图 5.10 投影 成 像 
设 (X 了 Y，2Z) 是 三 维 空间 中 任意 点 四 的 世界 坐标 。 以 下 讨论 都 假设 Z >f， 即 所 有 客观 
场景 中 感 兴趣 的 点 都 在 镜头 前 面 。 第 一 步 要 建立 点 丈 (X，Y，2Z ) 与 其 投影 到 图 像 平面 的 坐标 
间 的 联系 ， 借 助 相 似 三 角形 得 到 














X 有 _X 
人 (5. 36) 
a LA 了 
f ZZ-f f-Z 
式 中 , 和 了 前 的 负 号 表示 图 像 像 点 反 转 了 。 由 式 (5. 36) 可 得 到 三 维 投影 后 的 图 像 平面 坐标 
“= 大 
= 
5. 37 
es ( ) 
f= 光 


这 些 等 式 是 非 线性 的 ， 因 为 它们 分 母 中 含 变量 Z。 可 以 借助 齐 次 坐标 将 它们 表示 成 线性 矩阵 
的 形式 。 
空间 一 个 点 对 应 的 笛 卡 儿 坐 标 XYZ 的 齐 次 坐标 定义 为 (KX ，kY，k 巡 ,有 )。 其 中 ,是 任 
意 非 零 常数 。 将 齐 次 坐标 变 回 笛 卡 儿 坐 标 可 用 第 4 个 坐标 量 去 除 前 三 个 坐标 量 得 到 。 这 样 一 
个 笛 卡 儿 志 界 坐 标 系统 中 的 点 的 矢量 形式 为 
W=[X 了 2]" (5. 38) 
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对 应 的 齐 次 坐标 为 
W,=[kX kyY kZ ££] (5. 39) 
定义 透视 变换 矩阵 为 
10 0 0 
0 1 0 0 
P= (5. 40) 
00 1 0 
0 0 -LA 1 
P 和 Wo, 的 乘积 给 出 了 一 个 矢量 c. ， 即 
x 10 0 0]kX kX 
y 0 1 0 06 ky 
c =| |=P = = (5. 41 ) 
z 00 1 082Z 1Z 
1 0 0 -LA 1 — hkZ/f+k 


c, 的 元 素 是 齐 次 形式 的 摄像 机 坐标 ， 这 些 坐 标 可 用 c, 的 第 四 项 分 别 去 除 前 三 项 转换 成 
笛 卡 儿 形 式 。 所 以 摄像 机 坐标 系 中 任意 点 笛 卡 儿 坐标 可 表示 成 矢量 形式 ， 即 
c=[x y | 1 (5. 42 ) 
式 中 ee 的 前 两 项 是 三 维 空间 点 (X，Y，2Z) 投影 到 图 像 平 面 后 的 坐标 (*，y) ， 第 三 项 在 图 
5. 10 所 示 的 模型 中 无 用 ， 但 表示 投影 变换 物 点 与 像 点 的 比例 关系 ， 在 逆 投 影 变 换 中 可 以 起 
到 自由 变量 的 作用 。 











(2) 逆 变换 
逆 投 影 变 换 将 一 个 图 像 点 反 过 来 映射 回 三 维 空间 。 从 式 (5. 41 ) 可 以 得 到 
W,=P-!c, (5. 43) 
其 中 
10 0 0 
0 1 0 0 
己 -! = (5. 44) 
00 1 0 
00 1/1 





在 逆 投 影 变换 中 ， 不 能 由 像 坐 标 求 出 三 维 空间 点 坐标 ， 其 本 质 原 因 是 由 于 三 维 客观 场景 
映射 到 像 平面 是 多 点 对 一 点 的 变换 。 像 点 的 [x” yy ] 对 应 于 过 [x”y” 0] 和 [0 0 月 的 直 
线 上 的 所 有 共 线 三 维 点 的 集合 。 这 条 线 的 方程 在 世界 坐标 系 可 由 式 (5. 42 ) 得 到 ， 即 





X=5(f-2) 
人 
0 
式 (5.45) 表 明 除 非 对 产生 图 像 点 的 三 维 空间 点 有 一 些 先 验 知识 (如 知道 Z 坐标 ) ， 否 则 不 可 
能 将 一 个 三 维 点 的 坐标 从 它 的 图 像 中 完全 恢复 过 来 。 
背 助 这 一 结论 ， 用 c, 的 z' 项 作为 一 个 自由 变量 建立 逆 透 视 变 换 ， 设 
c,=[kx’ ky’ kz’ k] (5. 46) 


根据 式 (5.43) 有 


762 
* 了 kz’ 
W,= | 各 jy 肛 pd (5.47) 
转换 成 世界 坐标 为 


T 





W=[X 了 2]" (5. 48) 


-| 各 起 用 
f+z f+z f+z 
换 句 话说 ， 把 z' 作 为 自由 变量 可 以 得 到 以 下 三 个 等 式 ，; 





We (5. 49) 











如 果 在 最 后 一 式 中 用 Z 解 出 z'， 代 入 前 两 式 可 以 得 到 


Ey 
/ (5. 50) 


了 
"3 2Z) 


(3) 结 论 

投影 变换 是 三 维 空间 的 一 条 射线 上 的 所 有 点 ， 对 应 图 像 平面 上 的 一 个 像 点 ， 空 间 一 点 可 
得 惟一 像 点 ， 而 一 个 像 点 对 应 一 条 射线 上 的 无 数 空间 点 。 利 用 逆 透 视 变换 将 三 维 空间 点 从 其 
图 像 中 恢复 出 来 需要 知道 该 点 的 至 少 一 个 世界 坐标 。 

2. 世界 坐标 系 与 摄像 机 坐标 分 开 时 的 摄像 机 ZI 


WX, YZ) 


模型 

考虑 更 一 般 的 情况 ， 即 摄像 机 坐标 系 和 世界 
坐标 系 分 开 的 情况 ， 但 仍 将 平面 xy 和 像 平 面 xy' 
重合 。 此 时 摄像 机 坐标 系 代表 了 摄像 机 的 位 姿 。 

图 $. 11 所 示 为 这 种 情况 下 的 摄像 机 几何 模 
型 ， 像 平面 中 心 ( 原 点 ) 与 世界 坐标 系 的 位 置 偏差 
记 为 矢量 D， 其 分 量 为 D,、D,、D.。 假 设 摄像 机 
分 别 以 a、B6、y 角度 绕 x、y、z 轴 转 动 ， 则 坐标 
系 平移 矩阵 为 








<y 














y= 图 5.11 世界 坐标 系 与 摄像 机 坐标 系 不 重 
0 10 -D a 

0 0 1 -DD. 

0 00 1 


坐标 系 绕 x 转动 a 朋 ， 则 坐标 系 旋 转 和 矩阵 为 


0 sing cosQ 





1 0 0 
0 cosa -sinag (5. 52) 


坐标 系 绕 y 轴 转 动 B 角 ， 则 坐标 系 旋转 矩阵 为 
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| cosg 0 -sinB 
Rs=| 0 1 0 (5. 53) 
LSsinB 0 cosB 
坐标 系 绕 z 轴 转 动 y 角 ， 则 坐标 系 旋转 和 矩阵 为 
| cosy -siny 0 
R,=| siny cosy 0 (5. 54) 
| 0 0 1 





旋转 和 矩阵 的 计算 3 顺序 有 关 ， 如 以 ya 一 B 顺序 旋转 ， 即 先 绕 z 轴 转 动 y 角 。 然 后 以 新 
的 坐标 轴 为 基准 ， 绕 x 轴 转 动 a 角 。 最 后 绕 y 轴 转 动 B 角 。 则 旋转 矩阵 可 写 为 














es -SinBsinawsiny -cosBsiny - sinBsinawcosy -sinBcosa 
R=R,RR, = cosBsiny COSQCOSY — sina (5.55) 
sinBcosy + cosBsinasiny -sinBsiny + cosBsinacosy cosBceosa 
先 作 平移 变换 ， 青 做 旋转 变换 ， 将 R 并 入 平移 矢量 ， 则 平移 旋转 矩阵 为 
ol dl 
及 7 = 加 (5. 56) 
0 1J10 1 0 1 
由 此 建立 了 世界 坐标 系 和 摄像 机 坐标 系 之 间 的 变换 关系 为 
c, = RiW, (5.57) 
此 时 ， 摄 像 机 观察 到 的 齐 次 世界 点 在 摄像 机 坐标 系 中 具有 如 下 形式 : 
= PRj,W, (5. 58) 





式 中 ,，W,=[hX 有 及 有 "为 齐 次 世界 坐标 ; P 为 透视 变换 和 矩阵; R 和 了 TT 表 示 的 是 摄像 
机 的 空间 位 置 和 朝向 。 这 些 参数 称 为 外 部 参数 。 

3. 通用 摄像 机 模型 

考虑 更 加 一 般 的 情况 ， 即 世界 坐标 系 、 摄 像 机 坐标 系 和 像 平 面 坐标 系 都 不 重合 。 此 外 ， 
还 考虑 如 下 两 个 因素 : 

1) 摄 像 机 镜头 的 畸变 误差 ， 像 平面 上 的 成 像 位 置 与 前 述 线 性 变换 公式 计算 出 的 透视 变 
换 投影 结果 有 偏差 。 

2) 计算 机 中 使 用 的 图 像 坐 标 单位 是 存储 器 中 离散 像素 的 个 数 ， 所 以 像 平 面 上 的 连续 坐 
标 还 需 取 整 转换 为 离散 坐标 。 

图 5. 12 所 示 为 考虑 这 些 因 素 时 的 通用 摄像 机 模型 示意 图 。 


全 WY Dy ce y 3) 






























图 5.12 通用 摄像 机 模型 示意 图 
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如 图 5. 12 所 示 ， 摄 像 机 坐标 系 的 原点 o 位 于 摄像 机 的 镜头 中 心 ， 像 平面 坐标 中 心 o 位 
于 光 轴 上 ， 由 小 孔 成 像 模 型 ，oo' =f, 了 为 焦距 。 如 图 5. 13 所 示 ， 从 客观 场景 到 数字 图 像 的 
成 像 变 换 可 看 作 由 以 下 4 步 组 成 : 


1 2 3 4 
XYZ Xz X'y! xy* Uv 


到 5.13 ”从 客观 场景 到 数字 图 像 的 成 像 变 换 步 又 
(1) 从 世界 坐标 (和 了，2Z ) 到 摄像 机 三 维 坐标 (x*，y，z) 的 变换 
由 前 述 摄像 机 模型 可 知 ， 变 换 可 表示 为 





























x X 
y| rR THY 
z| |o 1|2 | 
1 1 


式 中 ，R 和 了 分 别 为 3 x3 的 旋转 矩阵 (两 坐标 系 三 组 对 应 坐标 轴 间 夹 角 的 函数 ) 和 1 x3 的 
平移 矢量 。 
(2) 从 摄像 机 三 维 坐 标 (x，y，z) 到 无 失真 像 平 面 理想 坐标 (x'，y') 之 间 的 变换 有 











x =f 
(5. 60) 
ye 
将 式 (5. 60) 用 齐 次 坐标 形式 与 矩阵 表示 为 
xz [jz 0 0 0] 
-|0 pz 0 ,| (5. 61) 
1 0 0 10| 
1 
(3) 从 无 失真 像 平面 理想 坐标 (x'，y') 到 受 镜头 畸变 影响 而 偏 移 的 实际 像 平面 坐标 (%， 


7) 的 变换 
有 


(5. 62) 


式 中 ，As 和 4; 代表 镜头 畸变 。 

(4) 从 像 平面 坐标 (x'，y') 到 图 像 坐标 (x，u) 的 变换 ( 见 图 5. 14) 

1) 图 像 坐标 系 “摄像 机 采集 的 数字 图 像 在 计算 机 内 可 以 存储 为 数组 ， 数 组 中 每 一 个 元 
素 为 像素 。 在 图 像 上 定义 直角 坐标 系 ww， 每 一 像素 坐标 分 别 是 该 像素 在 数组 中 的 行 数 和 列 
数 。 所 以 ，w 是 以 像素 为 单位 的 图 像 坐标 系 坐 标 。 

2) 像 平面 坐标 系 ” 图 像 坐标 系 是 以 像素 为 单位 的 坐标 系 ， 而 像 平面 坐标 系 x'y' 是 连续 从 
标 系 ， 或 物理 单位 坐标 系 。 用 (ww，v) 表示 图 像 坐标 ，(x'，y') 表示 像 平面 坐标 ，x'y' 坐标 系 
原点 定义 在 摄像 机 光 轴 与 图 像 平 面 的 交点 (wu,，w) 处， 称 为 像 主 点 。 在 *' 轴 入 轴 方 向 上 像 
素 之 间 的 距离 为 5, 和 $, 。 则 两 坐标 系 之 间 的 关系 为 
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u = +MY' + uo Oo 
. (5. 63) 
2 三 5 + vo 
表示 成 矩阵 形式 全 加 
u l/S,. 从 uo Tx’ 
v|=| 0 1/S, vo ly (5.64) 
1 0 0 1J1 
由 于 摄像 机 制造 及 工艺 等 原因 ， 像素 点 可 能 发 生 畸  。 |y 








变 定义 3 SN 点 四 变节 恋 小 
DT 
图 像 不 确定 因子 、 倾 射 因 子 等 。 和 矩阵 5 称 为 内 参数 矩 


阵 。 
综 上 所 述 ， 当 世界 坐标 、 摄 像 机 坐标 、 像 平面 坐标 、 图 像 坐标 都 分 开 且 不 考虑 畸变 影响 


时 的 通用 摄像 机 模型 可 表示 为 









































xX 
|] [l/sS. 0 xlA 00 0 
R 了 | 了 
ziv|=| 0 1/S, vlI0 ff 0 0 | | 
0 1|Z 
1 | 0 0 1JL0 0 0 
i x (5.65) 
0 /S 0 | 
ys 0 1|z 
L 0 0 1 0 1 








=MM,W, =MW., 
al 只 与 摄像 机 内 部 结构 有 关 ， 称 摄像 机 内 部 参数 。 主 要 包括 x 方向 尺度 因子 f/S,，y 方向 尺度 
因子 /YS,， 像 主 点 在 图 像 坐标 系 中 的 坐标 (u。，vw,) ， 上 畸变 因子 1。M, 只 与 摄像 机 相对 于 世界 坐 
标 系 的 方位 有 关 ， 称 为 摄像 机 的 外 部 参数 。 外 部 参数 可 以 认为 是 12 个 ， 包 括 旋转 矩阵 R 的 9 
个 参数 和 平移 矩阵 的 3 个 参数 ; 也 可 以 定义 为 6 个 ,包括 旋转 矩阵 的 3 个 偏转 角 和 平移 矩阵 的 


3 个 参数 。W 为 空间 点 在 世界 坐标 系 下 的 齐 次 坐标 。 摄 像 机 标定 过 程 如 图 5. 15 所 示 。 
计算 机 屏幕 





m(u, v) 


| uU Zz 
v O (u0;00) pe 
一 -- YY 











zc=P[R(TW)] 
X 
u fh HK Ww fT M3 Tx 
| 0 办 : R= m1 Po 全 | 7 全 Zz 
lL 0 0 1 31 12 3 由 1 

















扫 5.15 摄像 机 标定 过 程 
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上 述 摄像 机 模型 为 线性 模型 ， 如 果 已 知 摄像 机 的 内 外 参数 ， 即 矩阵 MM 已 知 ， 对 任何 空 
间 点 ， 知 道 其 世界 坐标 ， 就 可 以 求 出 其 图 像 像素 坐标 系 中 该 图 像 点 的 坐标 。 反 过 来 ， 如 果 已 
知 空间 某 点 的 图 像 坐标 ， 即 使 已 知 其 内 外 参数 ， 空 间 坐 标 也 不 是 惟一 确定 的 ， 它 对 应 空间 的 
一 条 射线 。 当 考虑 摄像 机 镜头 畸变 时 ， 摄 像 机 模型 为 非 线 性 模型 ， 有 


加 中 网 和 
= 十 
y y A 

















5.2 摄像 机 标定 


1. 摄像 机 标定 内 容 

摄像 机 标定 实际 上 是 要 求 出 6 个 外 参数 、5 个 内 参数 ， 即 旋转 和 平移 矩阵 卫 和 了 中 的 三 
个 坐标 系 旋 转角 度 和 坐标 系 平移 量 (f, =f//S,, f=f/S,，wuo，v0o， 人) ， 以 及 各 种 畸变 系数 |、 
kp、p1、pPs、s1、5s 等 。 若 不 考虑 离散 后 像素 变形 (不 是 矩形 方块 ) 或 者 成 像 平面 不 与 光 轴 正 
交 ， 则 可 以 不 考虑 畸变 因子 久 。 一 般 情况 下 ， 畸 变 系数 只 考虑 径 向 畸变 系数 ， 并 设 hh = = 
ko 








如 果 已 知 摄像 机 的 内 外 参数 ， 即 矩阵 M 已 知 ， 对 任何 空间 点 到， 知道 它 的 世界 坐标 
[X 了 Z 1 ,就 可 以 求 出 其 图 像 像素 坐标 系 中 该 图 像 点 w 的 坐标 (u,v)。 反 过 来 ， 如 果 
已 知 空间 某 点 的 图 像 坐 标 ， 即 使 已 知 内 外 参数 ， 空 间 坐标 也 不 是 惟一 确定 的 ， 它 对 应 空间 的 
一 条 射线 。 

2. 经 典 标 定 方法 

经 典 标定 方法 主要 包括 透视 变换 法 、 张 正 友 法 、 直 接线 性 变换 法 、 两 步 法 和 双 平 面 法 
等 。 其 中 ， 直 接线 性 变换 是 最 优化 算法 ， 两 步 法 进一步 考虑 了 上 畸变 补偿 ， 双 平面 法 合理 运用 
了 摄像 机 的 成 像 模型 。 经 典 标定 方法 的 标定 流程 如 下 : 

1) 布置 标定 点 ， 固 定 摄像 机 进行 拍摄 。 

2) 测 量 各 标定 点 的 像 平面 坐标 (w，wvw) 。 

3) 将 各 标定 点 相应 的 像 平 面 坐 标 (w,， wv) 及 世界 空间 坐标 (X,，Y,，2Z) 代 入 摄像 机 模型 式 
中 ， 根 据 标定 方法 ， 求 解 摄像 机 内 外 参数 。 


5.2. 1 摄像 机 标定 的 透视 变换 法 


不 考虑 摄像 机 镜头 的 非 线 性 畸变 ， 那 么 从 物体 点 的 三 维 到 图 像 点 的 二 维 变换 是 线性 变 
换 ， 透 视 变换 中 的 系数 为 未 知 数 。 如 果 给 定 足 够 多 点 的 三 维 世界 坐标 及 其 相应 的 图 像 坐标 ， 
就 可 以 利用 线性 变换 矩阵 中 的 各 个 元 素 ， 求 得 摄像 机 的 参数 ， 即 先 求 透视 变换 矩阵 ， 然 后 由 
求 得 的 透视 变换 矩阵 分 解 得 到 摄像 机 的 内 外 参数 。 透 视 变 换 法 的 优点 是 不 需 非 线性 优化 方程 
求解 ， 运 算 速度 较 快 ， 能 够 实现 摄像 机 参数 的 实时 计算 。 透 视 变 换 法 的 有 以 下 缺点 : 

1) 标 定 过 程 中 不 考虑 镜头 的 非 线性 畸变 ， 使 得 标定 精度 受到 一 定 的 影响 。 研 究 表明 ， 
在 做 三 维 测量 时 ， 忽略 镜头 畸变 是 不 可 取 的 。 

2) 线 性 方程 组 中 未 知 参 数 的 个 数 大 于 世界 坐标 系 自由 度 的 数目 ， 未 知 数 不 是 互相 独立 
的 。 在 图 像 含有 噪声 的 情况 下 ， 解 得 线性 方程 中 的 未 知 数 也 许 能 够 很 好 地 符合 这 一 线性 方 
程 ， 但 由 此 分 解 得 到 的 参数 值 却 未 必 能 与 世界 坐标 系 情况 很 好 符合 ， 使 精度 受到 一 定 限 制 。 
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1. 线性 参数 的 最 小 二 来 估计 

(1) 最 小 二 乘法 原理 

当 测 量 次 数 多 于 未 知 参数 的 数目 时 ， 即 所 得 的 误差 方程 式 的 数目 多 于 未 知 数 的 数目 ， 直 
接 用 一 般 代数 方程 的 方法 无 法 求解 未 知 参数 。 最 小 二 乘法 则 可 以 将 误差 方程 转化 为 确定 解 得 
代数 方程 组 (方程 式 的 数目 正好 等 于 未 知 数 的 个 数 )， 从 而 可 求解 出 这 些 未 知 参数 。 这 个 确 
定 解 得 代数 方程 组 称 为 最 小 二 乘法 估计 的 正规 方程 或 法 方程 。 

线性 参数 的 最 小 二 乘法 处 理 程序 可 归结 为 ， 首 先 根据 具体 问题 列 出 误差 方程 式 ， 再 根据 

二 乘 准 则 和 最 小 二 乘 原 理 ， 利 用 求 极 值 的 方法 将 误差 方程 转化 为 正规 方程 ;然后 求解 正 
规 方程 ， 得 到 解 的 估计 量 。 对 于 非 线性 参数 ， 可 先 将 其 线性 化 ， 然 后 按 上 述 线性 参数 的 最 小 
二 乘法 处 理 程序 处 理 。 因 此 ， 建 立正 规 方程 是 待 求 参数 最 小 二 乘 处 理 的 基本 环节 。 

线性 参数 方程 的 一 般 形 式 为 (n >m) 

y =k td y+ 


Y, = do 和 + ayXy 十 … + nl, 



































n>m (5.67) 


Y, = QnX + Qa A + QimX 


六 
. 


差 方 程 为 
= 六 一 (auX, + ap 万 + amX,) 


vs =Y, 一 (aa 和 二 022X 十 + QnX,) 








(5. 68) 
2 二 Y, - (qk, + a Dp + a lk,) 
二 乘 估计 就 是 求 X, 的 估计 值 X， 使 得 
> (v;)” = min (5.69) 
证 1 
即 
> (Y. 三 > = min (5. 70) 
站 专业 j=1 
下 面 讨论 最 小 二 乘法 原理 的 矩阵 形式 。 
设 列 矢量 为 
了 
有 nxm 阶 算 阵 
CI Ci Qi 
区 吕 C21 (02 C2 
Ql Qi 2 Cn 


式 中 ， Ql QQ, ,为 方程 的 nxm 个 系数 ; VV DD, 为 误差 ; Xs X,， We XX, 
为 待 求 的 估计 量 。 则 线性 参数 的 误差 方程 为 
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即 


最 小 二 乘 评价 准则 有 


即 


(2) 正 规 方程 


线性 参数 的 误差 方程 式 为 


现 求 式 (5.77) 的 佑 计量 读 ， 名，… 








vi 六 Ql Qi2 Qim Xl 
22 _ > CQ21 (2 Co2m 部 (5.71) 
7 六 CA Wp Qim 六 
V=Y-A¥ (5.72) 
vi 
1? 
[vw ov v, | ”|= min 《5. 73 ) 
Zn 
V'V=min (5.74) 
(Y -AX)'(Y-AX)=min (5.75) 
三 二 和 二 (ai 总 + anY, + + amX,) 
v, =Y, (aa 和 + a + + a X,) (5.76) 
Zn = (QiX + a 未 + a X,) 
> (0)? 二 Vi 十 十 +v = min (5.77) 


，X,， 可 利用 求 极 值 的 方法 来 满足 式 (5.77) 的 条 


件 。 为 此 ， 对 误差 二 次 方 和 > (w,)* 求 偏 导数 ， 并 令 其 为 零 , 有 


即 


(5. 78) 


| 
S 
~ 
| 
= 
SS 
十 
SQ 
S 
Ree 
十 
一 
SQ 
三 
~ 
总 
六 -一 


即 


同 理 


入 


= - 2a 1 六 一 (anX, + ai 人 ainX,) | 


入 入 


-2a 1Y, 年 (a X, + apX, + 十 Qn YX, ) | 


入 


— — 2a, {|Y, 一 (a¥, 十 QZ +… 和 +a XI)| 


nm m 


=0 
即 
a (2 %) 
和 = ai |Y, (ai 和 + Qi + 十 amnX,) | 
0X, 
+ 4 | 旋 : 二 (a + qd, 本 ql, ) | 
十 Ci | Y, J (auX + a Pb gl, ) | 
=0 
即 


= awd + da 二 二 do =0 


同 理 


一 -2a | Y, (au 六 +a 
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(5. 79) 


(5. 80) 


(5. 81) 


(5. 82) 


(5. 83) 


(5. 84) 
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即 
3 (>) 
二 ain | 六 (anX + apAX + 十 ainX,,) | 
0X, 
a (5. 85) 
十 Qo | 了 2 (aiX + GX + 示 Qs, ) | 
+ “+ Qim | 六 (au 万 a NX, 二 Qim 7 ) } 
=0 
即 
3 (2 7) 
一 一 -一 三 QImd1 + C2m72 本 人 全 本 Qimdn = 0 (5. 86) 
0X, 
注意 到 式 (5. 86) 的 二 阶 导 数 恒 为 正 ， 有 
9 人 > x») n 
ee 2 > anan > 0 
07 i=1 
人 
一 一 -一 =2>anan >0 (5. 87 ) 
OA i=1 
TR 
一 一 -一 = 2 > Qin Qim > 0 
90X is1 


由 些 可知， 上面 各 方程 求 得 的 极 值 是 最 小 值 ， 满 足 最 小 二 乘 条 件 ， 因 而 也 是 所 要 求 的 估计 
量 ， 最 后 把 它 写 为 





v, =0 
QV + pV 十 十 =0 (5. 88) 


QV 十 Q25125 十 十 Q 


nl 


QimVd1 + Oom22 十 + Qnmd =0 


式 (5. 88 ) 即 为 线性 参数 最 小 二 乘 处 理 算法 的 正规 方程 。 这 是 一 个 m 元 线性 方程 组 ， 当 其 系 
数 行列 式 不 为 零 时 ， 有 惟一 确定 的 解 ， 由 此 可 以 解 得 欲求 的 佑 计量 。 因 而 它 可 表示 为 











Qu 0 ”| 0 
CQ12 C22 CD Lp 至 0 (5 89 ) 
CI1m Co2m Qim 2 0 
即 
A'V=0 (5. 90) 


这 就 是 矩阵 表示 的 正规 方程 ， 又 因为 
V=Y-AX (5. 91) 
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所 以 正规 方程 又 可 表示 为 
A'Y-A'AX=0 (5. 92) 
(ATA)X=A'Y (5.93) 
所 以 
=(A'A) -477 (5.94) 
2. 摄像 机 标定 的 透视 变换 法 
将 透视 变换 矩阵 和 成 像 模 型 写 为 
u mM My M3 Ma 
4 no My Ns 77224 . (5. 95) 
Z 
1 M3 Ma M33 M3 1 
式 中 , [X 了 Z 1] 是 空间 三 维 点 的 世界 坐标 矢量 ; [wx wv 1] 为 相应 的 图 像 坐标 矢量 ，; 





mu 为 透视 变换 矩阵 M 的 元 素 。 式 (5.95 ) 包 含 如 下 三 个 方程 : 
zu =miN tmoY +maZ +mia 


(5.96) 


2 md tmoY +mL + mg 


z=maX+myY +maZL + ma 

在 三 个 方程 中 ， 用 第 三 个 方程 分 别 去 除 第 一 个 方程 和 第 二 个 方程 ， 整 理 消去 z 后 ,得 到 如 下 
关于 m, 的 线性 方程 ， 即 

miX+moY +maZ tm — mu — myuyY -mauZ = um 

(5.97) 

mK +moyY +maZ tm — mvh -mawvY — mvL = vm 
式 (5.97) 描 述 了 三 维 世 界 坐 标点 矢量 [X 了 Z 1] 与 相应 图 像 点 矢量 [u wv 1] 之 间 的 
关系 。 如 果 已 知 三 维 世 界 坐标 和 相应 图 像 坐标 ， 将 变换 矩阵 看 作 未 知 数 ， 则 共有 12 个 未 知 
数 。 对 于 每 一 个 物体 点 ， 都 有 上 述 的 两 个 方程 。 因 此 ， 取 6 个 物体 点 ， 就 可 以 得 到 12 个 方 
程 ， 表 示 成 矩阵 形式 为 

















KM=U (5. 98) 
其 中 
Fx YZ 10 0 0 0 ux -uy -uwu2, 
0 0 0 0 YZ 1 oxX oy -v2, 
TZ 1 0 0 0 0 wh, -wh -wbZ, 
0 0 00% % ZZ 1 wo -wh -wpZ, 
XZ 10 0 0 0 wu, -wh -Jw2, 
0 0 00 ZZ 1 ok -nh -wz 
a A 
0 0 00%% YZ 1 ox -uy -v2 
KX YZ 1 0 0 0 0 uk -wy -wuZ, 
0 0 00% FZ 1 ok -oY -v2 
XY Z 1 0 0 0 0 -of uy -wuZ 
[0 0 00X YZ 1 oN -wy -v2 
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M=[m ma ma ma ma My ma My Ma Ma mas] 
U=[u ai 有 
M 和 抢 阵 乘 以 任何 不 为 零 的 数 ， 不 影响 (X，Y，Z) 与 (wxw，o) 的 关系 ， 一 般 设 ms, =1。 标 定时 
取样 点 数 为 n， 则 共有 2n 个 方程 ，11 个 未 知 数 , 2n 宇 11， 方 程 没 有 准确 解 ， 所 以 采用 最 小 
二 乘 佑 计 求 出 11 个 参数 。 由 最 小 二 乘法 可 得 
M=(KK) -KU (5.99) 
求 出 系数 矩阵 M 后 ， 可 根据 式 (5. 65) ， 解 得 摄像 机 的 内 外 参数 。 求 矩阵 MM 时， 设 my 
=1， 所 求 距 阵 MM 与 实际 矩阵 MM 相差 一 个 may 因 子 。 因 此 有 如 下 关系 : 


























mi my mas ma| Ff/S, 0 w, 0 pe 
ma ma my ms ma|=| 0 JS vw 0 | | (5. 100) 
m1 ms ms 1 L 0 0 1 
即 
Mi mi fs, 0 wu, 0 : 区 
ma M3 mayl=| 0 f/S, , . (5. 101) 
M; 1 0 0 1 0® 7 
0 1 
设 a =//S,，a, = 太 /S,， 为 水 平方 向 和 垂直 方向 的 尺度 因子 ， 则 有 
Mi mi Fa,R! +uR! aT, + 了 
ma My ma |=| Ry +voRs a,T, +volT, (5. 102) 
M 1| | 有 7 


式 中 ,Mi (i=1 ~3) 为 M 和 矩阵 的 第 i 行 的 前 3 个 元 素 组 成 的 行 撩 量 ; mu(i=1 ~3) 为 轩 算 阵 
第 i 行 第 4 列 元 素 ; RI (i=1~3) 为 旋转 矩阵 R 的 第 i 行 ; 7,，7,,，7. 分 别 为 平移 矢量 了 的 
三 个 分 量 。 比 较 上 式 两 边 可 知 ，maM; = Rs;， 由 于 Rs 是 正 交 单位 矩阵 的 第 3 行 , 且 |R | =1 
(矢量 的 模 ) ， 因 此 可 以 从 ma |M |=1 求 出 











ee i (5. 109) 
再 由 以 下 式 子 可 得 出 Rj、u。、v6。、a,、a,， 有 

及 ;= ma M, (5. 104) 
uo = (QRT + uoR!) Rs =m, MM,; (5. 105) 
vo = (oR; +voR;)R, = mi MM,; (5. 106) 
a, =ma |M, x M, | (5. 107) 
a, =m3a |M, x M,; | (5. 108) 

式 中 ,符号 x 表示 矢量 积 运算 符 。 由 以 上 求 出 的 参数 可 进一步 求 出 以 下 参数 . 
R=—*(M, -uM,) (5. 109) 


R, = 过 (MD -woM,) (5. 110) 


y 
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了 = ms (5.111) 
m 
T= (mu -uo) (5. 112) 
m 
T= (my —%) (5.113) 
下 面 介绍 上 述 参 数 的 具体 计算 过 程 。 
(1 ) uo ， Vo 的 可 得 计算 过 程 
由 式 (5. 102) 
ma Mi =a,Ri +uoR3 (5.114) 
所 以 
(mM )R, 三 (a.R! + uoR; )R; (5.115) 
即 
myMimaM; = (oa Ri + uoR;)R; =a,RIR;, +u RR, (5.116) 


由 于 R 是 单位 正 交 矩阵， 所 以 RIR: =0( 正 交 矢 量 的 数量 积 ) 。R3R, =1( 模 为 1 的 矢量 自身 
的 数量 积 ) ， 则 











maMima Ms; =a,RIR; +uoR3R, =uo (5.117) 
即 
us = m3 MIM, (5.118) 
同 理 可 求 得 
Vo =my MM,; 
(2)a,, a, 的 计算 过 程 
由 my Mi =a,R1 本 uoR; 可 得 
maM) =a,R,| +uoR, (5.119) 
a, uo a, 
mai [Mi xM;|= | (coR +wR,) xM,|= (RxR;) +—(R;, xR,)|= 
M4 M34 77234 
因此 解 得 
a, =7Ti3 | xM, | (5. 120) 
同 理 可 求 得 
CQ = m3 |M, x M,; | 
(3)R,，R; 的 计算 过 程 
由 mMi =a,Ri +uoR3 可 得 
maM) = ,及 +uoR, (5. 121) 
则 
maM) =aR, + umaM, (5. 122) 
即 
77234 
Ri = (30 -uM,) (入 123 ) 


同 理 可 求 得 


174 





77234 
R, = 6: (M, -voM,;) 
(4)7,，7, ,7 的 计算 过 程 
由 式 (5. 102) 可 得 
也 =m (5. 124) 
由 mamua =a,.T, + uolT, 可 得 到 
N34 
T= (ma -uo) (5. 125) 


同 理 可 求 得 
m 
(入 =— (my -20) 


综 上 所 述 ， 由 空间 6 个 以 上 的 已 知 点 及 它们 的 图 像 点 坐标 就 能 够 求 出 矩阵 M， 并 求 出 全 
部 内 外 参数 。 

以 上 介绍 了 摄像 机 标定 的 透视 变换 法 的 计算 过 程 ， 在 用 真实 数据 进行 实验 时 ， 需 要 注意 
以 下 问题 ， 

1) 和 矩阵 M 确定 了 空间 点 坐标 与 它 的 图 像 点 坐标 的 关系 。 在 许多 应 用 场合 ， 如 立体 视觉 
系统 ， 计 算 和 矩阵 M 后 ， 不必 再 分 解 出 摄像 机 内 外 参数 。 也 就 是 说 ， 和 矩阵 M 本 身 代表 了 摄像 
机 参数 。 但 这 些 参数 没有 具体 的 物理 意义 ， 在 有 些 文献 资料 中 称 为 隐 参 数 。 一 般 情 况 下 ， 投 
影 变 换 矩 阵 确 定 后 ， 不 进行 内 外 参数 的 分 解 ， 称 为 隐 式 标定 。 而 在 有 些 应 用 场合 ， 如 运动 分 
析 ， 则 需要 将 矩阵 M 分 解 ， 从 而 求 出 摄像 机 的 内 外 参数 。 相 应 的 标定 过 程 称 为 显 式 标定 。 

2) 和 矩阵 M 由 4 个 摄像 机 内 部 参数 及 R 与 7 所 确定 。 由 矩阵 R 是 正 交 单位 矩阵 可 知 ，R 
和 了 的 独立 变量 数 为 6， 因 此 和 抢 阵 M 由 10 个 独立 变量 所 确定 。 但 矩阵 MM 为 3 x4 矩阵， 有 
12 个 参数 。 由 于 在 求 和 矩阵 M 时 ms 可 指定 为 任意 不 为 零 的 常数 ， 故 矩阵 M 由 11 个 参数 决 
定 。 可 见 这 11 个 参数 并 非 互 相 独 立 ， 存 在 着 变量 之 间 的 约束 关系 。 但 由 线性 方法 求解 这 些 
参数 时 ， 并 没有 考虑 这 些 变 量 之 间 的 约束 关系 ， 因 此 当 数 据 有 误差 的 情况 下 ， 计 算 结 果 是 有 
误差 的 ， 而 且 误 差 在 各 参数 间 的 分 配 也 没有 按 它们 之 间 的 约束 关系 考虑 。 实 验 表 明 ， 用 上 述 
方法 求解 的 矩阵 M 在 分 解 内 外 参数 时 ， 有 较 大 的 误差 。 为 此 在 用 线性 求解 矩阵 M 时 。 需 考 
虑 变量 之 间 的 约束 关系 。 


5. 2. 2 ”摄像 机 标定 两 步 法 


摄像 机 非 线 性 模型 除 包 括 线性 模型 中 的 全 部 参数 外 ， 还 包括 非 线性 径 向 畸变 参数 、h， 
和 切 向 畸变 参数 p, 、p,。 线 性 模型 的 参数 和 非 线 性 模型 的 参数 一 起 构成 了 非 线 性 模型 的 摄像 
机 内 部 参数 。 

非 线 性 模型 求解 是 由 非 线 性 优化 方法 来 估计 ， 如 广泛 采用 的 Levenberg Marquardt(LM ) 
优化 算法 和 Newton Raphson( NR ) 优 化 算法 。 这 些 方法 都 涉及 非 线 性 方程 求解 ， 或 需 假设 摄 
像 机 部 分 内 参数 可 由 其 他 方法 测 出 ; 或 者 用 线性 模型 首先 计算 出 线性 模型 的 参数 ， 作 为 近似 
初 值 ， 再 用 迭代 方法 计算 精确 解 。 

针对 三 维 立体 靶 标 上 的 特征 点 ， 用 线性 模型 首先 计算 出 线性 模型 的 参数 ， 作 为 近似 值 ， 
再 用 友 代 的 方法 计算 精确 解 ， 是 非 线性 模型 摄像 机 标定 较为 有 效 的 方法 。 
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先 利 用 线性 变换 方法 或 透视 变换 方法 求解 摄像 机 参数 ， 再 以 求 得 的 参数 作为 初始 值 ， 考 
虑 畸变 因素 ， 利 用 非 线 性 优化 方法 进一步 提高 标定 精度 ， 就 形成 了 所 谓 的 两 步 法 。 

典型 两 步 法 是 基于 径 向 排列 约束 RAC 的 两 步 法 : 第 一 步 是 利用 最 小 二 乘法 解 超 定 线性 
方程 ， 求 得 外 部 参数 ; 第 二 步 求解 内 部 参数 ， 先 假定 摄像 机 无 镜头 畸变 ， 求 解 超 定 线性 方程 
组 给 出 初 值 。 再 结合 非 线性 优化 方法 获得 全 部 参数 。 两 步 法 计算 量 适中 、 精 度 较 高 。 

1. 两 步 法 采用 的 摄像 机 模型 

如 图 5. 16 所 示 ， 设 (X，Y，2Z ) 是 三 维 世 界 坐标 系 中 某 目标 点 己 的 三 维 坐标 。 摄 像 机 坐 
标 系 定义 为 原点 在 摄像 机 光学 中 心 ，z 轴 与 光 轴 重合 。(x，y，z) 是 同一 点 己 在 摄像 机 坐标 
系 中 的 三 维 坐 标 。x'o'y' 是 原点 在 光 轴 z 与 图 像 平面 的 交点 o' 点 平行 于 x,，y 轴 的 像 平 面 坐标 
系 。 有 效 焦距 了 是 图 像 平面 和 光学 中 心 的 距离 。(x’，y') 是 小 孔 成 像 模型 下 世界 坐标 点 P 的 
像 平面 坐标 。(x”，,，y“ ) 是 由 于 摄像 机 镜头 畸变 引起 偏 移 的 实际 像 平面 坐标 。(wu，, wv) 是 以 像 
素 为 单位 的 图 像 坐 标 。(w,。，wo) 是 像 主 点 坐标 。 与 前 文 类 似 ， 从 点 了 世界 坐标 (XX，Y，2Z) 通 
过 投影 变换 映射 为 图 像 坐 标 由 以 下 步骤 完成 。 

(1) 由 世界 坐标 系 到 摄像 机 坐标 转换 

x 大 














x X 
y| [R TIY|. 
. 可， | 了 或 | 7 中 | (5. 126) 
Zz Z 
1 1 
式 中 , R 为 3 x3 旋转 和 矩阵，T 为 3 x1 平移 和 矩阵。 
(2) 成 像 变换 
-A 
(5. 127) 
fj | 
7 7 
(3 ) 畴 变 模型 


造成 成 像 坐标 侦 差 畸变 有 径 向 畸变 、 偏 心 畸 变 和 薄 楼 镜 畸 变 。 只 考虑 径 向 畸变 并 用 二 阶 
多 项 式 近 似 描 述 径 向 畸变 ， 有 
A =x[ k(x +y )] 





I (5. 128) 
A, =yL k(x +y )] 
理想 像 平面 坐标 和 实际 像 平面 坐标 的 关系 如 下 : 
x SL ee (5. 129) 
y=y [1l+k(x +y )] 
式 中 , 开 为 径 向 畸变 系数 。 
(4) 实 际 像 平面 坐标 到 图 像 坐 标的 转换 
w=uo th 
” (5. 130 ) 
v=v0 + 


式 中 ,为 尺度 因子 ; 5， = S,N./N; 为 像素 行 方向 的 等 效 间距 。 所 谓 等 效 间距 是 指 相 邻 两 个 
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像素 对 应 的 CCD 阵列 中 的 感光 单元 间距 。 假 定 CCD 感光 阵列 行 相 邻 单元 间距 为 5S,， 
从 感光 阵列 到 像素 阵列 的 处 理 过 程 如 下 : 图 像 获 取 硬 件 首先 对 
每 一 行 感光 单元 利用 零 阶 采样 保持 器 获得 模拟 波 ， 然 后 再 对 该 波 进行 采样 ， 


一 行 的 感光 单元 个 数 为 N.。 


CCD 每 


得 到 一 行 个 


像素 。 这 样 理想 情况 下 像素 行 方向 上 的 等 效 距离 为 5, = S,Ns/N。 ， 由 于 图 像 扫描 是 逐 行进 
行 的 ， 像 素 列 方向 上 的 等 效 间距 与 感光 阵列 列 方向 的 实际 间距 相同 ， 均 为 5,。 








通常 情况 下 ，CCD 生产 商 提供 的 S,、S, 可 以 
达到 亚 微米 精度 ，N.. 和 N, 对 于 特定 CCD 和 图 像 采 
集 卡 为 已 知 值 ， 进 而 5S,'、5, 均 为 已 知 值 。 但 在 实 
际 情况 下 ， 图 像 获取 硬件 和 摄像 机 扫描 硬件 间 存 在 
的 同步 差 或 摄像 机 硬件 本 身 时 钟 的 不 精确 会 造成 一 
些 不 确定 因素 ， 直 接 影响 像素 行 方向 的 等 效 间距 
值 ， 因 此 引入 尺度 引子 来 表示 这 种 不 确定 性 。 

2. 两 步 法 原理 

摄像 机 标定 中 ， 需 标定 外 部 参数 6 个 ， 内 部 
参数 6 个 ， 即 ww、v。、S,、5S,、f 5。 其 中 ,7 





























vo、 S,、 S, 通过 预 标定 确定 。 采 用 两 步 标 定 法 ， | PAYZ) 
可 以 先 求解 外 部 6 个 参数 ， 再 计算 2 个 内 部 参数 。 

根据 摄像 机 成 像 模型 ， 理 想 的 透视 投影 关系 人 
如 图 5.16 所 示 。 空 间 点 P(X,，Y,，2Z) 在 摄像 机 像 平面 上 的 理想 像素 点 为 p'(x'，y’) ， 由 于 摄 
像 机 镜头 的 径 向 畸变 ， 实 际 像素 点 为 p" (x" ，y" )。 它 与 P(X，Y，Z) 之 间 不 符合 投影 透视 
六 亲 


由 图 5. 16 可 以 看 出 ， 
物 点 在 摄像 机 坐标 系 下 的 坐标 值 相同 。 
1 ) 假设 摄像 机 镜头 畸变 只 是 径 
点 P (x ， 
2 ) 摄 像 机 的 等 效 焦 距 f 对 x*， 





op 与 PP 的 方向 一 致 ，P, 是 摄像 机 光 轴 上 的 一 点 ， 


向 的 ， 那 么 无 论 华西 变 如 何 变化 ， 从 图 像 中 心 点 
了 ) 的 矢量 op 7 的 方向 将 保持 不 变 ， 并 有 op 与 己方 .了 平行 。 
y” 产生 同样 的 影响 ， 六 的 大 小 不 影 


其 z 坐标 与 
0' 到 图 像 


影响 矢量 0'p* ‘op ”的 方向 。 


3 ) 世界 坐标 系 治 着 x” 2 轴 和 7 轴 放 置 和 平移 ， 使 得 每 一 点 有 op” 平行 于 P,P, 对 x*，y 


产生 的 影响 相同 ， 从 而 op 的 方向 保持 不 变 





4) 在 每 一 点 处 矢量 0'p* 与 P, PB 的 平 行 约束 条 件 ， 与 径 向 畸变 表达 式 的 系数 、 等 效 焦 距 人 


平移 分 量 7 无关 。 而 R 和 7,、7, 受 该 约束 制约 。 


因此 ， 运 用 径 向 排列 约束 ， 存 在 如 下 关系 : 


/A 
y 了 
1 Ty “Ts 了 
设 R 三 | 六 Ts Te -| 9 根据 坐标 转换 公式 ， 则 





X=rX+trY+trZ+T, 
Y=rX+rsY+reZ+T, 
ZL=rX+reY+rZ+T, 


(5. 131) 


(5. 132) 
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根据 RAC 含义 ， 有 
x” TX+rnY+rZ+T, 
y” TX+trY+reZ+T, 





; (5. 133) 
整理 得 
[nT, 
mA 了 
ra/T, 
[Xy” By 2 Oy Xe Ye 2] T/T, |=x° ee 
ra/T, 
rs/T, 
Lre/T, 

行 撩 量 [Xy” ”ZVZy”y” -Xx” -Yrx” -2Zx”] 是 已 知 的 ， 由 标定 模板 和 图 像 处 理 
确定 ， 列 矢量 [地 AT，/T，n/T，T/T，r/T，rs/T，re/7T,] 是 待 求 参 数 。 

对 每 一 标定 模板 目标 点 P,, 已 知 其 和 、Y、Z、x*、y”* 就 可 以 列 出 如 上 的 一 个 方程 。R 
有 9 个 参数 ， 但 是 其 正 交 性 规定 了 R 仅 有 三 个 自由 度 ， 再 加 上 7,、7, 正好 五 个 独立 变量 ， 
故 上 式 可 惟一 确定 旋转 矩阵 丸和 了 、7,。 

求 出 R 和 7T,、 了 后 ,再 利用 最 优化 方法 求解 有 效 焦距 /了 的 7 分 量 和 透镜 畸变 系数 上 。 


5.2.3 ”摄像 机 标定 两 步 法 的 标定 过 程 


1， 内 部 参数 预 标定 

(1) 图 像 中 心 标定 

图 像 中 心 (mm ，wm) ， 即 光 轴 穿 过 图 像 平面 之 点 ， 理 论 上 是 像 平面 的 中 心 点 ， 但 在 应 用 中 
图 像 实际 中 心 与 理想 像 平 面 中 心 并 不 重合 。 产 生 这 种 现象 的 原因 是 多 方面 的 ， 如 摄像 机 
CCD 安装 平面 与 光 轴 存在 倾角 误差 ; 图像 采 集 卡 的 窗口 电路 未 将 其 窗口 取 在 正中 间 ， 使 光 
心 偏 离 ;图像 采集 卡 采样 的 时 序 错误 ， 造 成 每 一 行 采 样 的 开始 时 间 不 同 。 

1 ) 变 焦距 法 ”在 摄像 机 透镜 系统 中 ， 当 透镜 有 效 焦距 变化 时 ， 图 像 区 域 发 生变 动 ， 但 
图 像 区 域 中心 将 稳 而 不 变 。 耕 在 有 效 焦距 变动 时 ,， 设 所 取 针 筷 沿 光 轴 方向 移动 ， 显 然 此 时 图 
像 区 域 中 心 将 处 于 光 轴 与 图 像 的 焦点 上 。 此 点 即 是 成 像 中 心 。 即 用 改变 有 效 焦距 的 方法 可 以 
确定 镜头 的 光学 中 心 。 用 变焦 距 法 标定 镜头 光学 中 心 时 ， 其 标定 精度 是 最 低 的 ， 标 定 误差 可 
达 28 像素 ， 重 复 性 为 +20 像素 ， 故 此 方法 一 般 只 用 于 透镜 光学 中 心 的 粗略 估计 。 

2) 径 向 准 直 约束 法 “” 径 向 准 直 条 件 是 指 当 成 像 中 心 确定 无 误差 时 ， 根 据 空 间 坐标 变换 
和 成 像 关 系 ， 可 将 径 向 约束 条 件 方程 进一步 表示 为 

XX x TX+trY+rZ+T, 

Y 7y” rnX+trY+treZ+T, 
采用 平面 模板 ,设置 世界 坐标 系 时 使 Z =0， 则 式 (5. 135 ) 变 为 
yi (TX tr +T,) xi (raX; +rsY, +T,) =0 (5. 136) 
取 5 个 以 上 的 标定 点 ， 则 可 通过 非 线 性 求解 部 分 参数 ， 然 后 通过 非 线 性 迭代 方法 求解 径 向 畸 
变 系数 、 有 效 焦 距 、 和 平移 和 矩阵 了 及 畸变 中 心 。 可 以 通过 寻找 使 式 (5. 136 ) 残 差 最 小 的 点 坐标 





























(5. 135 ) 
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值 来 找到 光学 中 心 。 

3 ) 直接 光学 法 ”标定 原理 如 图 5. 17 所 示 。 当 激光 束 射 向 镜头 表面 ， 大 部 分 光束 透 过 镜 
头 ， 部 分 光束 由 镜头 各 表面 反射 。 当 激光 束 与 镜头 光 轴 不 同 轴 时 ， 在 激光 束 出 射 光 阑 面 上 可 
观察 到 由 反射 光束 形成 的 多 个 亮度 不 同 的 、 分 布 在 光 阑 面 上 不 同位 置 的 干涉 光斑 。 此 时 调整 
激光 束 相对 于 镜头 的 位 置 ， 到 所 有 的 反射 干涉 光斑 均 与 激光 出 射 光束 重合 时 ， 表 明 此 时 激光 
束 与 镜头 轴线 同 轴 。 此 时 打开 摄像 机 ， 激 光束 在 CCD 像 面 上 的 像 点 即 为 镜头 光学 成 像 中 心 。 
需 指出 的 是 ， 必 须 仔 细 观 察 、 耐 心 调整 、 尽 可 能 将 所 有 干涉 光 王 ,包括 某 些 不 易 察觉 的 非常 
浊 淡 的 光斑 ， 都 要 调整 到 与 激光 出 射 光束 重合 。 否 则 ， 对 镜头 光学 中 心 的 标定 偏差 值 及 其 重 
复 性 有 很 大 影响 。 直 接 光 学 法 原理 简明 ， 可 用 于 对 镜头 成 像 中 心 直 接 进行 标定 ， 而 与 其 他 标 
定 参数 无 关 。 实 验 表明 ， 该 方法 标定 精度 高 ， 重 复 性 好 ， 是 一 种 可 行 的 标定 镜头 光学 中 心 的 
方法 ， 标 定 结果 在 实际 系统 中 效果 良好 。 
























































光 轴 成 像 中 心 
激光 器 二 二 一 一 一 
全 CCD 摄像 机 
兄 
光 盖 衰减 滤波 器 











图 5.17 直接 光学 法 确定 图 像 中 心 的 标定 原理 
4) 基 于 中 心 无 畸变 区 的 摄像 机 光学 中 心 标定 方法 “基于 中 心 无 畸变 区 的 摄像 机 光学 中 
心 标 定 方法 利用 的 是 透视 成 像 的 基本 原理 。 即 一 组 与 光 轴 平行 的 平行 线 在 无 限 远 处 的 交点 ， 
在 图 像 平 面 上 对 应 成 像 点 是 光学 中 心 ， 也 是 消 隐 点 。 光 学 中 心 标 定 方法 原理 如 图 5. 18 所 示 ， 
图 $. 19 所 示 是 光学 中 心 标 定 模 板 ， 提 取 黑 色 方 格 的 4 个 亚 像素 角 点 。 在 图 $. 18 中 点 4 、 
4 、4，Bi、B，、 Bi，C 、C、C Di 、D 、D; 分 别 是 模板 点 4， 有 B，C，, D 三 次 成 像 对 应 
点 ， 对 应 坐标 (x,,，y,)。 其 中 ,m=A, B，C，D; =1，2，3。 它 们 分 别 拟 合 出 4 个 模板 
点 4，B, C, D 在 平 直 导轨 上 移动 轨迹 (4 条 平行 线 ) 所 对 应 的 直线 轨迹 方程 y,, = kx, +b,， 
其 矩阵 求解 形式 为 
网 
m2 bp, 让 m2 


司 pa 1 Ym3 


























,m=A, B, C,D (5. 137) 

















通过 对 这 4 条 直线 方程 进行 拟 合 求解 交点 ， 可 以 得 到 光学 中 心 (w ，w ) 。 求 解 光 学 中 心 的 矩 
阵 表达 式 
[1 -Ek bi 
; 
| ba 网 (5. 138) 
1 -hk, 205 





对 式 (5. 137) 和 式 (5. 138 ) 用 最 小 二 乘法 求解 ， 便 可 得 到 模板 点 的 轨迹 方程 和 光学 中 心 坐 标 。 
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Al 加 
42 B» 
4 B3 
Oo A 隐 | B 
Gs D, © D 
C> 六 
Cl D, 
图 5.18 ”光学 中 心 标定 方法 原理 到 5.19 光学 中 心 标定 模板 
(2) 尺 度 因 子 标定 








对 尺度 因子 进行 标定 时 可 以 垂直 拍摄 一 个 圆 环 ， 然 后 计算 其 图 像 水 平方 向 和 垂直 方向 
的 直径 像素 比 ， 即 为 所 求 尺度 因子 ww。 这 种 方法 简便 且 能 够 保证 精度 。 

2. 标定 过 程 

当 使 用 两 步 法 进行 单 平面 模板 标定 时 ， 尺 度 因子 需要 事先 标定 。 当 标定 点 共 面 时 可 选取 
世界 坐标 系 ， 使 Z=0。 这 时 式 (5. 134) 中 ，m/T 、r/T 两 项 系数 恒 为 零 ， 于 是 有 
Tn/ 
mA 了 
[xXy” YY yy -Xx -yx |] T/T, |=x" (5. 139) 
ms/ 了 
Lrs/T, 














第 一 步 : 求解 旋转 矩阵 R 和 工 中 的 7,、7,。 

1) 拍 摄 一 幅 具 有 若干 共 面 特征 点 的 标定 模板 图 像 ， 利 用 图 像 处 理 方法 确定 若干 个 特征 
点 的 图 像 坐 标 ， 设 共 NN 个 点 ， 图 像 坐标 为 (x;，y;) ，i =1，…，N。 并 且 ， 假 设 这 些 点 相应 
的 世界 坐标 为 (X;，Y,，2,)。 

2) 对 每 个 点 按 1) 可 列 出 一 个 方程 ， 联 立 这 W 个 方程 ， 利 用 最 小 二 乘法 解 这 个 超 定 方程 
组 (CNW=5) ， 可 解 得 如 下 变量 : 

ui =r7/T,, w=7/T,, w=T/T,, w=r/T,, us=rs/T, (5. 140) 

3) 利 用 的 正 交 性 可 以 算出 7 和 ~- 六， 具体 步骤 如 下 ; 首先， 计算 |7, |， 有 

S, — (3 —4(uius -i 
2 (uus -wu )” 

式 中 ，S, =wi +w +W4 +u3。 其 次 ， 在 求 得 |7, | 后 ， 还 要 确定 7 的 符号 。 由 成 像 几 何 可 知 ， 
x 和 对应 有 相同 的 符号 ，y” 和 了 了 也 有 相同 符号 ， 可 以 利用 这 一 点 来 确定 了 的 符号 。 即 在 求 
得 |7 | 后 任 选 一 特征 点 P;， 先 假定 7 为 正 ， 有 


ni =uT,, r=wT,, r=uT,, rs=usT, 


I 人 (5. 142) 

















7 = (5. 141 1) 





X=rX+rY+T,, y=rX+rsY+T, 
若 x 与 x*, yy 与 y" 同 号 , 则 了 7 符号 为 下 ,否则 7 符号 为 负 。 最 后 ,对 于 R, 已 知 7、、 
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m4、Ts， 利 用 正 交 性 和 右手 坐标 系 特性 可 计算 R， 有 
1 
R=|r, rs S(1-m-r)' (5. 143) 
Br. ig 79 
式 中 ，S = -sgn(rirs +r2rs); r;，rs， rs 可 由 头 两 行 的 又 乘 得 到 。 
r=Sr,(1 -rr7) 人 -mm(1L -rn 
m= Se(l=7 =r ==) (5. 144) 


ry =rirs — Tora 


给 定 m、m> 、rm 、r， 则 尺 有 两 个 解 ， 另 一 个 为 





疗 语 -(1-7 -7)'" 
R=| i 态 。 = 汪 T 记 -友信 (5. 145) 
一 7 Tg 79 


具体 选择 哪 一 个 ， 可 由 试探 法 确定 。 即 先 任 选 一 个 ， 向 下 计算 ， 若 据 此 R 值 计 算出 的 f<0， 
则 此 次 选取 不 对 ， 应 选取 另 一 个 R 的 解 。 和 否则 若 和 >0， 则 选取 正确 。 
第 二 步 : 计算 有 效 焦距 /7 的 7 分量 和 透镜 畸变 系数 此 。 








(5. 146) 
y= yk ) + (y 9 
待 求 变量 是 /、k、7.,， 假设 
H,=rX+rY+7, 
H,=rX+rsY+V, 
- (5. 147 ) 
W=rX+reyY 
fi =fh 
可 得 
Hf+H((x*) +(y))f -x )T=(x" )W 
(5. 148) 


Hf+H, (C(x ) +(y) f(y T= )W 
对 NN 个 特征 点 ， 利 用 最 小 二 乘法 对 上 述 两 个 方程 进行 联合 最 优 和 参数 估计 ， 进 一 步 求 得 ff、 
7T.， 进 而 求 得 fk、7.。 


5.2.4 ”摄像 机 标定 的 张 正 友 法 


张 正 友 法 是 介 于 传统 标定 方法 和 自 标 定 方法 之 间 的 一 种 方法 。 这 种 方法 既 避 免 了 传统 方 
法 设备 要 求 高 ， 操 作 繁琐 的 缺点 ， 又 较 自 标定 方法 精度 高 。 张 正 友 法 采用 平面 标定 模板 ， 只 
需 对 标定 模板 的 不 同方 向 进行 拍摄 ， 而 不 需 知 道 标定 板 的 运动 方式 。 

张 正 友 法 标定 流程 如 图 5. 20 所 示 。 首 先 ， 建 立 平面 网 格 状 的 标定 模板 ， 网 格 状 模板 上 
的 网 格 交 叉 点 ， 就 是 标定 控制 点 。 其 在 网 格 标定 模板 上 的 坐标 值 是 已 知 的 。 这 个 坐标 值 是 世 
界 坐 标 系 的 坐标 值 。 建 立 标定 模板 后 ， 接 下 来 从 不 同 角度 拍摄 模板 ， 得 到 多 幅 标定 模板 图 




















像 。 然 后 ， 对 标定 模板 进行 图 像 处 理 ， 检 测 标定 模板 上 的 标定 [十字 下 靖 册 林村 定居 人 
控制 点 图 像 坐标 。 接 下 来 ， 根 据 控制 点 的 模板 坐标 和 图 像 坐 标 


估计 摄像 机 参数 的 解析 解 。 然 后 ， 通 过 最 小 方差 求 出 偏转 系数 。 | 
最 后 ， 根 据 非 线性 规划 求 出 最 终 的 迭代 结果 。 











1. 基本 投影 方程 











(1) 符 号 说 明 从 图 像 中 获取 标定 控制 点 
首先 ,根据 前 述 的 摄像 机 模型 ， 对 本 小 节 中 将 要 用 到 的 符 
号 进行 说 明 。 将 计算 机 图 像 坐 标 系 内 的 二 维 点 矢量 表示 为 m = 估计 摄像 机 参数 解析 解 
[u, v]", 世界 坐标 系 内 的 三 维 空间 点 表示 为 M=[X 了 
Z]"。 它们 的 齐 次 矢量 表示 形式 分 别 为 砚 =[u wv 1]",，M = | 通过 最 小 方差 求 出 偏转 系数 
[X 了 2 1]"。 摄像 机 采用 小 孔 透 视 模 型 可 以 得 到 
z 志 =KIR 7T] 放 (5. 149) 非 线性 规划 求 出 迭代 结果 
式 中 ,，[R 7] 是 外 参数 矩阵 ; K 是 内 参数 矩阵 ， 即 图 5.20” 张 正 友 法 标定 流程 
f, KH uo 
K=I0 f vw (5. 150) 
0 0 1 





式 中 ，(w， ww) 为 像 主 点 坐标 ; /,， /分 别 为 w、v 轴 的 尺度 因子 ; j 为 畸变 因子 。 
(2) 标 定 模板 平面 和 图 像 的 单 应 性 
令 标 定 模 板 平面 的 Z 坐标 为 零 ( 世界 坐标 系 ) ， 其 中 旋转 答 阵 可 以 表示 为 R=[r, 5， 
7,]"，7 为 摄像 机 平移 矢量 ， 则 有 


ID 





Uu 
SIv 


1 








Ny 
= 天 [7 r, r, T] < =K[r, rz, | (5.151) 
1 


NN 
全 


1 
令 M'=[x y 1]， 则 有 
ed (5. 152) 
H=Klr, r, TI| 
式 中 ,五 为 单 应 矩阵 。 
(3) 对 内 部 参数 的 约束 
给 定 标定 模板 平面 和 摄取 图 像 后 ， 单 应 性 可 以 估计 出 来 。 令 单 应 性 矩阵 五 = [h， hh， 
hh;] ， 从 式 (5. 152 ) 中 可 以 得 到 
[hy hh, hl] =AKIr, 了 ] 
式 中 ,和 为 任意 比例 因子 。 利 用 x, 、r, 的 正 交 关 系 可 以 得 到 
nhK Kh,=0 (5.153) 
NK Kh, =hiK Kh, (5. 154) 
如 果 没 有 上 述 从 实际 需要 或 内 在 隐 仿 的 条 件 中 得 到 约束 ， 进 一 步 计 算是 不 可 能 的 。 因 为 
有 8 个 自由 度 , 6 个 内 部 参数 ， 但 只 能 得 到 2 个 约束 方程 。 其 中 的 K-*K-! 明 显 是 描述 了 1 
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个 二 次 曲线 。 下 面 将 会 给 出 几何 解释 。 








(4) 几 何 解释 
不 难得 到 在 摄像 机 坐标 系 中 描述 的 模板 平面 的 方程 ， 即 
有 | | (5.155) 
nT 2 
W 


式 中 ， 下 =0， 表 示 在 无 穷 远 处 的 平面 ; 否则 天 =1。 由 射影 几何 的 知识 可 知 这 个 平面 与 无 穷 
远 处 的 平面 交 于 一 条 直线 ， 所 以 利用 旋转 矩阵 的 正 交 性 可 以 得 到 

rn 7 

|; | | 


是 这 条 直线 上 的 点 ， 这 条 直线 的 方程 可 以 写 为 


方 广 ar, + br, 
不。 -| [a=| | (5. 156) 
0 0 0 


现在 , 计算 上 面 直线 和 二 次 曲线 的 交点 。 定 义 匀 ,为 一 个 圆 极 点 且 满 足 站. 对。=0 则 可 
以 得 到 

















(ar +br,) (ar +br,) =0 (5.157) 
交点 在 图 像 平 面 上 的 投影 》 
m, =K(r, +ir,) =h, +ih, (5.158) 
很 明显 ， 这 个 是 上 面 所 提 到 的 二 次 曲线 上 的 点 ， 这 样 可 以 得 到 约束 
(hi +ih,) KK '(h,+ih,) =0 (5. 159) 


2. 标定 参数 的 求解 
在 标定 参数 求解 过 程 中 ， 首 先 将 得 到 解析 解 ， 然 后 利用 基于 最 大 似 然 的 非 线 性 方法 进行 
优化 ， 最 后 将 求解 考虑 镜头 的 畸变 的 标定 结 























(1) 解 析 解 
首先 令 
| 工 和 Voy — uof, 
外 fif, fof, 
DB B, B's i ( 机 
Y\Voy 一 oa/ Vo 
B=K-'K-!'-= B,, B,, B, 到 = 了 一 = 
0 fof, fof, fo Fs f 
Bs Bs Bs 2 
voy — uof, YCvoy ~ uof,) _ Ww (voy -uof,) a +1 
fof, fh f fof 办 
(和 .160 ) 


注意 到 B 是 对 称 的 ， 所 以 有 
5=[BD，BF，BP，B，B，B] (5. 161 ) 
令 五 , 是 矩阵 五 的 第 i 列 ， 可 以 得 到 
hi'Bh,=v,b (5. 162) 
其 中 
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二 = [ha hahothohs Nah thahs hoho hohs+hahs hahs]r (5.163) 
通过 上 一 节 所 述 的 约束 条 件 ， 可 以 将 式 (5. 162) 写 成 





v0 p=0 5. 164 
[| | > ) 

如 果 有 nn 幅 模 板 平面 的 图 像 则 可 以 得 到 
Vb =0 (5.165) 


式 中 , V 是 2n x6 矩阵。 当 n>2 时 ,可 以 得 到 5b 的 惟一 解 ， 并 根据 5b 来 求解 摄像 机 的 内 部 
参数 矩阵 K， 有 





及 = 人 玉民- 
Vo 二 (BB -BB,)/(BiB,, -Bi,) 
A=B,;,— [B's +vo( BiB - BiB,,) ]/Bi 





f= VA/BI (5. 166) 
J 一 ADNACBB2 -Bi,) 
YY 二 -Bfif,/A 


uo = Yvo/f, — Bafe/A 
只 要 内 部 参数 一 定 ， 则 外 部 参数 就 可 以 很 容易 得 到 
r=AK 7 
r,=AK 'h, 
。 (5.167) 
73 三 六 XT 
t=AK 'h, 
(2) 最 大 似 然 估 计 
上 面 的 求解 摄像 机 内 外 参数 的 方法 是 基于 最 小 距离 的 ， 但 这 在 物理 上 是 没有 什么 意义 
的 。 可 以 拍摄 具有 m 个 特征 点 的 n 张 模板 图 像 ， 每 个 点 都 有 独立 同 分 布 的 噪声 。 则 最 大 似 
然 解 可 以 通过 求解 下 列 式 的 最 小 值得 到 
> > | 加- 二 RD | (5. 168) 
式 中 ,页 = (K，R,，T,，M) 是 点 M, 的 投影 。 式 (5. 168) 是 一 个 非 线性 优化 的 问题 ， 可 以 利 
用 LM(Levenberg Marquardt) 优化 算法 (梯度 下 降 法 和 高 斯 牛顿 法 的 结合 ) 解决 。 不 过 这 需要 
很 好 的 初始 值 ， 这 些 需要 的 初始 化 的 值 包括 内 参数 和 矩阵 玉 ， 旋 转 和 矩阵 R, 和 平移 矩阵 7T.,( 其 
中 ,=1，2，…, 7)。 这 些 参 数 可 以 通过 上 面 提 到 的 方法 求 得 。 
(3 ) 非 线性 优化 算法 
根据 摄像 机 模型 ， 将 已 知 物体 空间 特征 点 投影 到 图 像 平 面 上 ， 得 到 该 特征 点 基于 摄像 机 
模型 的 理想 图 像 坐标 ( VU;，V,)。 理 想 图像 坐 标 与 摄像 机 实际 探测 到 的 图 像 坐 标 (w,，w,) 存 在 
偏差 。 在 这 种 情况 下 ， 需 要 用 非 线 性 优化 使 这 种 偏差 达到 最 小 ， 从 而 获得 使 偏差 最 小 时 的 参 
数 为 摄像 机 参数 的 估计 值 。 优 化 的 目标 函数 用 解析 式 表示 为 


F(x) = Pf) (5. 169 ) 






































有 户 (xz) = (局 一 本 证 ( 有 太一) (5. 170) 
因此 非 线 性 优化 的 过 程 就 是 使 式 (5. 169 ) 极 小 化 的 过 程 ， 即 


minF(x) = f(x) (5.171) 


式 中 , x=[x， x， … %] ,月 一 般 mn 宇 n。 式 (5. 171) 极 小 化 问题 的 解决 要 采用 递归 搜 
索 ， 因 此 目标 函数 R(zx) 的 极 小 化 过 程 的 计算 量 非常 大 。 可 采用 许多 非 线性 优化 算法 ， 其 中 
LM 优化 算法 的 速度 最 快 。 下 面 通过 论述 最 小 二 乘法 来 说 明 该 算法 。 

当 每 个 上 (xz) 是 x 的 线性 函数 时 ， 称 式 (5. 171 ) 为 线性 最 小 二 乘 问题 。 当 每 个 上 (xz ) 是 x 
的 非 线 性 函数 时 ， 称 式 (5. 171 ) 为 非 线性 最 小 二 乘 问题 。 

1) 线 性 最 小 二 乘 问题 ”在 式 (5.171) 中 ， 假 设 


fx) =px-b,, i=1, 2, :…, m (5. 172) 
式 中 ,，p, 为 n 维 列 矢 量 ; b, 为 实数 。 那 么 式 (5. 169) 可 用 和 矩阵 乘积 形式 来 表达 。 令 
pi b 
p2 b, 
4=| ?|,B=| : (5. 173 ) 
p, 4 
式 中 , 4 为 m xn 算 阵 ; B 为 m 维 列 矢量。 则 
fi(x) 
F(x) = > f(x) = f(x) hx) se f(x)) | 
和 (5. 174) 
f(x) 
= (Ax -b)'(Ax -5b) 
=xA'x-2bpAx+b'b 
现在 求 (x) 的 平稳 点 , 令 
VF(x) =2A"'Ax -2478 =0 (5. 175) 
即 F(x) 平 稳 点 满足 
A'Ax=A'b (5. 176) 
设 A 列 满 秩 ，A"A 为 n 阶 对 称 正定 矩阵 。 由 此 可 得 到 目标 函数 F(x) 的 平稳 点 为 
X=(A'A)-'A'b (5.177) 


由 于 (x) 是 凸 函数 ， 因 此 x 必 是 整体 极 小 点 。 对 于 线性 最 小 二 乘 问题 ， 只 要 474 非 奇异 
(可 逆 ) ， 就 可 以 用 式 (5. 177 ) 来 求解 。 

2) 非 线性 最 小 二 乘法 ” 设 式 (5. 169) 中 的 f(x) 是 非 线 性 函数 ， 且 F(x) 存在 连续 偏 
导数 。 解 决 这 类 问题 的 基本 思想 是 ， 通 过 解 一 系列 线性 最 小 二 乘 问题 的 解 来 求 非 线性 
最 小 二 乘 问题 的 解 。 设 x'" 是 解 的 第 次 近似 ， 在 x“ 处 将 f(x) 线 性 化 ， 这 样 原来 的 问 
题 转变 成 为 线性 最 小 二 乘 问题 。 运 用 式 (5.177) 求 出 这 0 + )， 把 它 作 
为 非 线性 最 小 二 乘 问题 的 第 有 +1 次 近似 。 Sa 重复 以 上 过 ， 直 到 收 全。 
具体 过 程 如 下 : 
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p(x) = + V(x) (x -x™) 
= Wx) x Vx) x -f(x )] i=1, 2,., m 
式 (5.178) 右 端 是 函数 (x) 在 点 x 展开 的 一 阶 Taylor 多 项 式 。 令 
p(x) = > gi (Xx) (5. 179) 


用 (x) 近似 (x)， 从 而 用 (x) 的 极 小 值 点 作为 目标 函数 F(x) 的 极 小 值 点 估计 。 现 在 求 
解 线性 最 小 二 乘 问题 ， 有 


(5. 178) 














minb (x) = min 记 p(x) (5. 180) 
这 里 记 作 
dfi(x®*) f(x™) . 9afi(x'") 
Vf(x®)! Ox Ox, OX, 
A, | : | : (5. 181) 
Vf Cx) 9f,(x™ ) 9f,(x™) 9f,(x™ ) 
Oxi OX, OX, 
vf (x'® ) x -f (x'® 】 
b | : | -f™ (5. 182) 
Vf (x ) x (RY ) 
其 中 
fi(x™) 
f(x™) 
9 = (5. 183 ) 
f(x ) 
所 以 g(x) 可 以 写成 
bx) =(Ax-b)'(Ax-b) (5. 184) 
按照 前 述 方法 可 以 得 到 
X =X0 (414) 4170 (5. 185 ) 
可 以 写成 递归 形式 
XD) = (ATA,) -47 f 0% (5. 186) 





把 x%**? 了 作为 F(x) 的 极 小 值 点 的 第 和 +1 次 近似 。 通 常 称 式 (5. 186) 为 Gauss-Newton 公 
式 。 矢 量 4 = - (A;4,) “A411” 称 作 在 点 x 处 Gauss-Newton 方向 。 为 保证 每 次 迭代 能 使 
目标 函数 值 下 降 ， 在 求 出 4d” 后 ,不 直接 用 x +qd 中 作为 第 +1 次 近似 ,而 是 从 x 出 发 ， 
沿 这 个 方向 进行 一 维 搜索 ， 有 

minF (x'™ +Ad™) (5. 187) 
求 出 步 长 和 A 后 , 令 

XD x +Ad® (5. 188) 
把 x 作为 第 +1 次 近似 。 以 此 类 推 ， 直 至 得 到 满足 要 求 的 解 。 
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在 最 小 二 乘法 中 ， 有 时 出 现 和 矩阵 4,4, 奇异 或 接近 奇异 的 情况 ， 这 时 求 (4,4, ) -会 遇 到 
很 大 困难 ， 甚 至 根本 不 能 进行 。 因 此 ， 需 要 对 最 小 二 乘法 做 进一步 的 修正 。 所 用 的 基本 技巧 
就 是 把 一 个 正定 对 角 阵 加 到 4,4, 上 ， 改 变 原 矩阵 的 特征 值 结构 ， 使 其 变 成 条 件数 较 好 的 对 
称 正定 矩阵 。LM 优化 算法 是 较为 有 效 的 修正 的 最 小 二 乘法 之 一 。 

(4) 径 向 扭曲 畸变 估计 

这 里 将 讨论 两 种 类 型 的 径 向 扭曲 。 实 验证 明 ， 在 某 些 应 用 中 ， 线 性 模型 不 能 准确 地 描述 
成 像 几 何 关系 ,无 其 在 使 用 广角 镜头 时 ， 在 远离 图 像 中 心 处 会 有 较 大 的 畸变 。 张 正 友 法 的 摄 
像 机 标定 只 考虑 了 径 向 畸变 ， 其 非 线性 描述 可 用 如 下 公式 表示 ; 

xX=x(l1 +kip’) 
yl (5. 189) 


p? = +y 








解决 上 述 径 向 畸变 有 两 种 方法 : 
第 一 种 方法 是 在 估计 完 其 他 参数 后 ， 再 估计 k 和 kk。。 这 样 就 会 给 出 理想 的 像素 坐标 (， 


2) 即 (x， y) 。 根据 u、 "的 成 像 坐标 上 = 了 +， v= t+, 所 以 从 式 (5. 189 ) 可 以 得 到 





[全 sm 
(vv) (x +y )” dh, 也 一 7 
写成 矩阵 形式 则 为 Dk =d。 利 用 n 幅 图 像 的 m 个 点 可 以 求 得 最 小 二 乘 解 为 

k=(D'D) "Dd (5. 191) 


车 设 x 方 向 和 y 方 向 的 畸变 系数 相等 ， 即 =， 则 可 以 利用 交 比 不 变性 来 求解 一 阶 径 
向 畸变 系数 ， 方 法 如 下 : 





7 A, B, C2 D, 


图 5.21 一 阶 径 向 畸变 系数 求解 示例 
如 图 5.21 所 示 ， 直 线 1 上 有 3 个 点 41、B,、C,， 若 以 41 、B 为 基础 点 ， 点 C 为 分 点 
(内 分 点 或 外 分 点 ) ， 则 由 分 点 与 基础 点 所 确定 的 两 有 向 线段 之 比 称 为 简单 比 ， 记 为 
SR(A,, B,, C,) =A1C./B,C, (5. 192) 
众所周知 ， 一 条 直线 上 4 个 点 中 2 个 简单 比 的 比值 称 为 交 比 。 如 直线 1 上 4 个 点 4、 
B,、C,、D, 的 交 比 为 
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SR(4 ，B ，C) 4C BD, 
SR(4,, B,， C) BC, AD, 
式 中 ，A, 、B 为 基础 点 对 ; C, 、D, 为 分 隔 点 对 。 则 交 比 不 变性 为 

CR(A,, B,, C,, D,) =CR(A,, B,, C,, D,) (5. 194) 
任意 选取 空间 中 共 线 的 4 个 点 ， 即 


忆 =(xw， ul， 5) ， P, = (%,, yw， Zi2 ) ?9 P; =(xia， yw Zu3 ) ， P, = (xu， Ya ， cp 其 
、 
交 比 为 


CR(A,, Bi, C,, D,)= 





(5. 193) 


(Ki — Ka) (Kia Ka) /Koo — Kas) (Kar — Xu) = CR 
(yi 一 Ya) (yw -ya)/ (yw 一 ya) (ya 一 yw) = CR4 (5. 195 ) 
(za 一 Za ) (za -24)/ (2Z0 一 Za ) (二 一 zu ) = CR4 


根据 刚体 不 变性 定律 、 摄 像 机 坐标 系 到 图 像 坐标 系 的 转换 起 =/ 于 ，y =/ 兰 及 交 比 不 
变性 定律 可 得 


(而 一 23 ) (wa 一 24 ) 


























= CR 
(22 一 X3 ) (XI 一 %4 ) 
5. 190 
(7 一 为 )(》2 —y4) _ 4 ) 
(7 -73) (% -Ya) 4 
将 式 (5. 189) 带 入 式 (5. 196) ， 整 理 移 项 后 可 得 
ml +nk +l=0 (5. 197) 
其 中 
m= (wp: -ps ) (zpy -pa ) -CRa(mp -Kpa ) (Kps -Naps ) 
n= (x -Xs) (zaps” -Xapa ) + (Na — Xa) (zip1” -zps ) 二 
CR (x —%4) (zxap3” -zaps ) + CR (%, 一 五) (zaps” -zp ) 
1 = (2 — Ns) (入 — Xa) — CR, (x —X) (No — Xs ) 
由 式 w= 了 +w， v= +w, 可 得 
j=d,(u-u), 7=d,(v 0%) (5. 198) 


可 见 ， 式 (5. 197) 是 一 个 关于 一 阶 径 向 畸变 参数 的 一 元 二 次 方程 ， 因 此 只 要 知道 空间 
中 一 组 共 线 4 个 点 的 交 比 值 和 相应 投影 点 的 实际 坐标 值 ， 就 可 以 解 得 一 阶 径 向 畸变 参数 。 通 
常 可 以 通过 选取 几 组 这 样 的 4 个 点 ， 采 用 最 小 二 乘法 来 线性 求 得 畸变 参数 。 
第 二 种 方法 直接 利用 LM 优化 算法 对 式 (5. 168 ) 进行 优化 ， 即 
和 
这 里 加 (4， 襄 ，，R;，t;，M,) 是 Mi 经 过 所 ，h, 扭曲 后 投影 的 点 ,假设 hh 和 所 的 初 
始 值 为 0， 其 他 步骤 同上 。 


5.2.5 ”摄像 机 标定 双 平 面 法 


双 平 面 法 中 没有 明确 的 使 用 摄像 机 的 模型 ， 它 是 通过 两 个 已 知 相关 平面 上 的 点 到 图 像 坐 
标 上 对 应 点 的 连 线 ， 利 用 插入 的 方法 求 得 摄像 机 的 相关 参数 。 














2 
m; - m(K,R,,T,,M,,k ,hk,) | (5. 199) 
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假设 在 空间 中 有 两 个 参考 平面 mr, ，7,。 在 这 两 个 平面 上 ， 分 别 定义 坐标 系 0,-X, 了 2 
和 0,-XY,2;。 其 中 ，( 庆 ，Y) en ，( 克 ， 驴 ) e 7;。 这 两 个 参考 系统 的 相互 转换 关系 可 以 
用 旋转 矩阵 及 和 平移 和 失 量 了 来 表示 ， 即 
从， 
|- (5. 200) 


XI 
2 2 


式 中 , R= (7i, 己 , 二),， T= (ti, by, 4b) 。 因 此 ， 对 于 平面 7,， 上 任何 一 点 P,: (X,, 了) 
e7,， 都 可 以 在 mi 中 表示 为 
3 如 
sn nl 
1 


Za 
假设 在 两 个 平面 上 有 许多 这 样 相 关 的 点 ， 那 么 这 些 点 与 它们 相对 应 的 图 像 上 的 点 之 间 的 

转换 可 以 通过 二 维 透视 变换 法 来 描述 。 对 于 平面 7,， 相 关 的 变换 可 以 写 为 

_ax+by+ec 

pxX+qy+r 








= RX, (5. 201) 











(5. 202) 


摄像 机 像 坐 标 (x , y) 可 以 用 像素 坐标 系 来 表示 ,， 即 x=(wu-wu)d, 和 y=(vw -20)d,。 将 
之 带 入 式 (5. 202) ， 并 用 (x +6,，y+6,) 代 替 (x，y)。 其 中 ，(w ，y) 为 经 过 镜头 畸变 后 的 真 
实 图 像 坐标 ，(6,，6, ) 为 修正 畸变 而 做 的 补偿 。 最 终 得 到 的 一 般 表 达 式 如 下 : 


7 = (5. 203 ) 


六 = (5. 204) 





X= (5. 205) 


又 = so (5. 206 ) 
Db iv 
式 (5. 203) ~ 式 (5.206) 构 成 了 一 组 利用 系数 {a} 和 {064 } 计 算 的 等 式 ， 通 过 这 些 等 式 
可 以 直接 用 线性 的 方法 来 计算 出 摄像 机 内 在 和 外 在 的 参数 。 利 用 这 些 转 换 系数 ， 图 像 平面 上 
的 任意 一 点 P， 都 可 以 在 两 个 参考 平面 上 找到 点 Pj 、P, 与 之 对 应 。 通 过 式 (5. 201) 连 接 Pi、 
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P,， 可 得 到 点 P 的 视线 ， 有 了 视线 方向 , 便 可 以 很 容易 地 进行 立体 三 角 测量 。 

这 种 双 平 面 的 标定 模型 是 由 Martins 等 人 首先 提出 ， 但 他 们 的 计算 方法 只 有 在 参考 平面 
平行 于 图 像 平 面 时 才 有 效 。 这 种 方法 的 优点 是 只 利用 线性 方法 就 可 以 解 得 有 关 参 数 ， 缺 点 是 
要 求解 大 量 的 未 知 参 数 ; 存在 过 分 参数 化 的 倾向 。 


5.2.6 畸变 校正 


镜头 畸变 校正 技术 就 是 通过 实验 方法 ， 预 先 求 出 摄像 机 镜头 几何 畸变 公式 中 的 系数 ， 实 
际 测 量 时 进行 反 畸 变 处 理 。 图 像 的 非 线性 畸变 校正 包括 两 方面 的 内 容 : 

1) 像素 点 位 置 移动 ”像素 点 移动 前 后 的 位 置 关 系 必 须 符 合 从 实际 图 像 到 理想 图 像 的 非 
线性 畸变 模型 ， 同 时 保持 灰 度 值 不 变 ， 称 之 为 几何 校正 。 

2) 灰 度 插值 问题 ” 相 邻 像素 点 位 置 移动 后 ， 像 素 点 之 间 的 像素 值 要 通过 灰 度 插值 实现 。 
常用 的 灰 度 插值 方法 有 最 近邻 域 法 、 双 线性 内 插 法 和 三 次 内 搬 法 。 

1. 公式 推导 

根据 畸变 公式 




















4.(x，7) =A,(x, y) +Au(x，7) +A, (x, y) 
Ce 
将 三 类 畸变 误差 模型 带 入 式 (5. 207) 可 得 到 
A lx’ ,yy )=kx (x ) + )) +[pi (3x ) + )) +2pyx y+si((x* ) +(y" )) 
(5. 208) 
A x ,yy )=ky (x ) + )) +[p (x ) +3 )) +2pix yy +s( (x ) +(y" )) 
(5. 209) 
如 果 考 虑 镜头 畸变 ， 需要 对 小 孔 成 像 模型 进行 修正 ， 实 际 像素 坐标 (x”" ，y” ) ， 理 想像 
素 坐 标 (x，y) 和 畸变 偏差 之 间 可 写 为 


| (S210) 
十 
ya Ly 4 ， 


于 


和 一 区 A,. 
.| | wo 


X¥-X*=AP (5.212) 


(5. 207) 





即 


和 矩阵 形式 为 


其 中 
ee 0 3 0 | 
0 y (G+)) 2 (x ) +30*) 0 (六 (六 
P=[k pi pp p, s! $s,] 
X=[x y] 
x =x yy] 
选择 3 个 以 上 的 标定 点 ， 一 个 标定 点 的 图 像 点 的 理想 值 和 实测 值 ， 可 建立 2 个 方程 ; 3 对 被 
测 点 像素 坐标 的 理想 值 和 实测 值 ， 可 建立 6 个 方程 。 假 设 3 对 被 测 点 像素 坐标 的 理想 值 和 实 
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测 值 分 别 为 
(x1, Y1), (01 yi ) ， (xz ，》2 ) ， Ca y; ) ， (2x3， 
则 和 珑 阵 4 变 为 
| (CO 六) 0 3(z ) + (7 )? 2x7 YT 
0 yr (Cx) + yr) ) 2xr YY (x7 )” +3(97 六 
了 7 (7) + (97 )°) 0 3(x2 ) + (2) 2x7 y2 
0 2 (7) + (2 )) 2x2 92 (x2 )” +3(92 )? 
3 (x3 ) + (93 )) 0 3(x3 ) + (3 )? 223 3 
上 0 % (0 ) + )) 2x3 73 (x3 六 +3(03 )? 





X1 一 %1 

S 

YL 

NX —% 

家 2 2 
XX = . 
Y2 二 水 2 

X3a 一 %3 

-3 一 3 








以 上 的 标定 点 ， 通 过 最 小 二 乘法 求 畸 变 系 数 矢 量 为 
P=(A'4)-'A'( 了 -XY*) 





2. 畸变 修正 





入 ) ， (23 > ys ) 


(zx? )? + (YF )? 0 
0 (x ) + OF )? 
(x2 ) + (92) 0 
0 (2 ) + ) 
(x3 ) + (3 )? 0 
0 (x ) + ) 
(5.213) 
(5.214) 


解 此 和 矩阵 方程 ， 就 可 求 出 镜头 畸变 系数 。 实 际 测量 时 ， 为 了 提高 测量 精度 ， 常 选取 超过 3 对 


(5.215) 


采用 棋盘 格 ， 平面 网 格 模板 ， 标 定时 使 网 格 中 心 和 摄像 机 光 心 重合 ， 例 如 通过 步 进 电动 














机 控制 工作 台 二 维 平面 移动 ， 使 圆 形 模 板 的 形 心 或 者 灰 度 重心 最 大 限度 地 接近 图 像 中心 ， 即 


帧 存 中 心 。 





理想 网 格 交 点 坐标 的 选取 采用 如 下 步 又 : 假设 中 心 无 畸变 ， 中 心 附近 小 范围 内 畸变 很 小 
而 可 以 忽略 ， 以 中 心 对 角 邻 域 的 4 个 网 格 交 点 (或 亚 像素 级 网 格 交 点 ) 坐标 为 无 畸变 的 理想 
点 ， 由 于 网 格 是 等 间距 的 ， 因 此 可 以 推算 出 其 他 网 格 交点 的 理想 坐标 。 











第 6 革 单 目 视 党 测量 

















从 视觉 组 成 和 测量 原理 来 看 ， 视 觉 坐标 测量 属于 非 笛 卡 儿 坐标 测量 ， 它 不 受 三 维 导轨 的 
限制 ， 可 以 实现 更 大 范围 的 坐标 测量 ， | 
系统 便于 携带 ， 非 常 适合 航空 、 航 天 、 船 舶 、 汽 车 制造 和 装配 领域 的 快速 现场 测量 ， 因 此 视 
觉 坐标 测量 机 的 应 用 前 景 非常 广泛 。 

单 目 视 觉 测量 是 指 利用 一 台 摄 像 机 或 数码 相机 拍摄 图 像 进 行 测量 工作 。 因 其 仅 需 一 台 视 
觉 传感器 对 景物 进行 图 像 采 集 ， 与 单 通 道 图 像 采 集 卡 和 计算 机 构成 单 目 视 觉 检测 系统 ， 所 以 
该 方法 的 优点 是 结构 简单 、 摄 像 机 标定 简单 ， 同 时 还 避免 了 立体 视觉 中 视 场 小 、 立 体 匹 配 难 
的 不 足 。 如 果 采 用 般 入 式 系统 ， 则 可 以 构成 便携 式 单 目 视觉 检测 系统 。 其 在 工农 业 生产 中 有 
着 广泛 的 应 用 。 

单 目 视觉 系统 可 实现 对 静态 物体 或 一 维 移 动物 体 的 测量 ， 如 生产 线 上 物体 的 移动 测量 
目标 运动 状态 的 测量 等 。 单 目 视 觉 测量 的 理论 基础 是 仿 射 几何 理论 和 摄影 几何 理论 ， 利 用 单 
幅 图 像 所 具有 的 场景 图 像 信息 实现 场景 中 的 几何 测量 。 多 用 于 测量 范围 较 小 和 场景 先 验 信息 
较 多 的 场合 。 

将 单 目 视觉 图 像 传 感 句 进行 移动 或 移动 被 测 物 也 能 够 获得 多 目 视觉 的 检测 效果 ， 相 当 于 
从 多 个 位 置 拍摄 同一 物体 ， 从 而 完成 立体 测量 。 但 由 于 标定 精度 弱 和 难以 同时 确定 摄像 机 与 
被 测 物体 之 间 的 相对 位 置 等 问题 ， 单 目 视 觉 的 整体 测量 精度 不 如 双 目 和 多 目 视觉 测量 系统 。 
ee 企 基 础 和 相关 技术 是 双 目 测量 乃至 多 目测 量 技术 的 基础 。 单 目 视觉 测 量 能 
人 够 满足 某 些 应 用 场合 实际 测量 的 要 求 。 

en tn 光 笔 式 三 坐标 测量 法 、 几 何 形状 约束 
法 、 几 何 光 学 法 和 结构 光 测 量 等 。 本 章 将 从 测量 原理 、 关 键 技术 等 方面 对 上 述 方法 进行 详细 


介绍 。 






















































































6.1 几何 相似 法 测量 


单 目 视觉 几何 相似 法 测量 是 对 应 于 被 测 对 象 的 几何 参数 在 同一 平面 内 的 情况 ， 此 时 被 测 
ee、 

1. 几何 相似 法 测量 的 简易 标定 

(1) 绝对 标定 

视觉 测量 的 绝对 标定 法 是 指 通过 标定 尺 或 者 标定 块 及 测量 的 标定 尺 或 标定 块 所 对 应 的 像 
素 个 数 来 计算 CCD 图 像 传感器 像素 值 分 辨 率 的 标定 方法 。 

(2) 相对 标定 

视觉 测量 的 相对 标定 法 ， 即 标准 件 法 。 已 知 标准 件 的 实际 尺寸 ， 通 过 测 得 标准 件 所 对 应 
的 像素 个 数 来 计算 CCD 像素 值 的 分 辨 率 ， 这 样 的 标定 法 称 为 相对 标定 法 。 

由 于 成 像 的 非 线 性 误差 影响 ， 并 且 测 量具 有 针对 性 ， 相 对 标定 法 的 测量 精度 比 绝对 标定 
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法 的 测量 精度 高 。 

如 上 分 析 ， 不 管 绝对 标定 还 是 相对 标定 ， 被 测 几 何 量 占据 的 像素 个 数 越 多 ， 测 量 分 辩 率 
越 高 ， 测 量 精度 也 越 高 。 例 如 ， 从 数量 级 上 看 ，10mm 的 工件 ， 成 像 后 占据 500 像素 ， 不 考 
虑 亚 像素 级 定位 精度 ， 则 相对 标定 法 测量 误差 为 0.4pm。 而 实时 在 线 批量 测量 中 ,利用 相 
对 标定 法 ， 即 使 边缘 定位 在 像素 级 ， 不 对 镜头 畸变 进行 校正 ， 也 可 能 获得 非常 高 的 检测 精度 
且 所 需 计 算 时 间 较 少 。 采 用 绝对 标定 法 ,在 CCD 图 像 传感器 分 辨 率 确 定 的 情况 下 ， 提 高 放 
大 倍数 、 减 少 视野 和 提高 边缘 定位 精度 ， 可 以 获得 较 高 的 测量 精度 。 

2. 二 维 参 数 测量 

根据 透视 投影 模型 ， 物 体 与 其 图 像 满足 相似 关系 ， 只 要 从 图 像 上 提取 所 需 参 数 ， 乘 上 实 
际 放大 倍数 ， 就 得 到 物体 的 实际 几何 参数 。 几 何 相似 法 测量 只 是 二 维 测 量 ， 主 要 有 二 维 几何 
位 置 、 形 状 、 变 形 测 量 、 位 移 和 速度 的 测量 等 。 下 面 说 明 几 何 相 似 法 测量 的 基本 原理 。 

摄像 机 选择 

计算 机 视觉 图 像 精 密 测 量 中 ， 假 设 工件 整体 尺寸 为 80mm x 80mm， 精 度 要求 0. Imm， 
计算 需要 什么 样 的 CCD 摄像 机 。 

算法 一 

精度 要 求 . 0. 1mm。 

摄像 机 选择 .可 把 0. 1mm 当做 像素 值 ， 因 此 CCD 分 辨 率 =80/0. 1 =800。 即 CCD 至 少 
要 有 800 x 800 像素 的 分 辨 率 。 由 于 没有 800 x 800 像素 分 辨 率 的 摄像 机 ， 因 此 按 此 算法 需要 
1000 x 1000 像素 分 辩 率 的 高 分 辨 率 摄像 机 。 

算法 二 (采用 亚 像素 技术 ) 

精度 要 求 : 0. 1mm， 设 亚 像素 边缘 定位 精度 为 0.5 像素 值 ， 空 间 分 辨 率 =0. 1mm x2 = 
0.2mm， 则 CCD 分 辨 率 =80/0.2 =400。 即 CCD 要 有 400 x 400 像素 的 分 辨 率 或 以 上 ， 因 此 
选用 分 辨 率 为 768 x 576 像素 左右 的 摄像 机 。 

同 理 ， 若 工件 大 小 为 8mm x 8mm， 选 取 分 辨 率 为 768 x 576 像素 摄像 机 ， 考 虑 有 效 素 为 
500， 则 不 考虑 亚 像素 技术 的 情况 下 ， 计 算 精 度 为 =8/500 =0.016mm; 考虑 亚 像素 技术 ， 边 
缘 定位 精度 为 1/2 像素 ， 则 计算 精度 =8/1000 =0. 008mm， 进 一 步 提高 亚 像素 的 定位 精度 和 
缩小 视野 ， 可 以 获得 微米 级 的 计算 精度 。 

由 上 述 实例 可 见 ， 采 用 同样 的 CCD 摄像 机 ， 单 目 视 觉 测量 精度 与 工件 大 小 、 标 定 方法 
和 软件 算法 有 很 大 的 关系 。 选 择 不 同 分 辨 率 的 CCD 摄像 机 可 以 获得 不 同 精度 的 测量 结果 。 


6.2 ”几何 形状 约束 法 测量 


几何 形状 约束 法 测量 主要 针对 某 些 特殊 形状 〈 如 圆 、 圆 柱 等 ) 的 被 测 对 象 ， 该 方法 充 
分 利用 目标 几何 形状 上 的 先 验 知识 和 约束 条 件 ， 只 需 一 台 摄 像 机 所 拍摄 的 单 幅 图 像 或 一 台 照 
相机 拍摄 的 单 张 相片 就 可 以 确定 目标 的 空间 三 维 姿 态 。 

如 图 6. 1 所 示 ， 空 间 圆 环 在 摄像 机 坐标 系 中 对 XOY 平面 平行 投影 图 一 般 为 椭圆 ，n' 为 空 
间 圆 法 线 n 在 XOY 平 面 内 的 投影 ，n 和 nn' 的 夹 角 中 即 为 高 低 角 ,n' 与 站 轴 夹 角 w 为 方位 角 ， 
中 和 w 就 是 空间 圆 法 线 在 摄像 机 坐标 系 中 的 姿态 角 。 

图 6. 1b 所 示 为 YO7 平面 的 正视 图 ， 法 线 的 投影 n' 和 椭圆 的 长 轴 垂 直 而 和 短 轴 重合 ， 
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图 6.1 空间 圆 投影 
因此 只 要 得 到 投影 椭圆 的 长 轴 方 向 就 可 以 确定 空间 圆 法 线 的 方位 角 w。 图 6. 1c 所 示 为 n'Z 
平面 视图 。 高 低 角 中 可 以 通过 投影 椭圆 的 长 轴 a 和 短 轴 65 求 得 ， 即 
中 = arcsin (2 ) (6.1) 
在 实际 应 用 中 ， 先 提取 图 像 中 椭圆 边缘 点 ， 然 后 通过 椭圆 曲线 拟 合 椭圆 ， 得 到 椭圆 的 长 
轴 、 短 轴 和 方向 等 信息 ， 就 可 以 得 到 空间 圆 法 线 的 方向 角 w 和 高 低 角 由 ， 从 而 测量 出 其 空间 
的 三 维 姿态 。 相 关 的 例子 有 运动 飞机 的 三 维 空间 姿态 测量 。 


6.3 ”基于 单 摄像 机 的 虚拟 立体 视觉 








6.3.1 虚拟 立体 视觉 简介 


普通 的 双 目 视觉 测量 系统 需 采 用 两 台 CCD 摄像 机 ， 成 本 较 高 ， 为 了 获得 更 高 的 测量 精 
度 ,， 需要 两 台 摄像 机 光学 中 心 之 间 的 基线 距离 较 远 ， 这 样 将 导致 系统 结构 体积 过 大 ; 另外 双 
目 视 觉 系统 中 两 台 摄 像 机 的 工作 状态 不 可 能 完全 一 致 ， 而 理想 的 双 目 视觉 系统 假设 两 侣 摄像 
机 是 完全 对 称 的 ， 这 样 必然 降低 系统 的 测量 精度 。 双 目 视觉 系统 两 台 摄 像 机 需 同 步 进行 图 像 
采集 ， 但 实际 图 像 采 集 则 需 切 换 采 集 左 右 摄像 机 的 图 像 ， 这 必然 造成 对 动态 目标 的 检测 误差 
和 检测 速度 变 慢 。 

针对 上 述 双 目 视觉 系统 的 不 足 ， 可 以 将 兴学 成 像 系统 和 单 台 摄 像 机 结合 ， 组 成 单 摄像 机 
双 目 视觉 系统 。 光 学 成 像 系 统 实际 上 是 一 些 棱镜 、 平 面 反射 镜 或 球面 反射 镜 组 成 的 具有 折射 
兼 反射 功能 的 光学 系统 。 即 使 用 多 个 光学 天 件 在 单 台 摄 像 机 中 形成 两 个 或 者 多 个 摄像 机 的 
像 。 相 对 于 被 观测 物体 来 说 ， 相 当 于 不 同 摄像 机 从 不 同 角度 去 观测 同一 物体 ， 因 而 具有 两 台 
摄像 机 的 同样 功能 ， 许 多 国外 学 者 采用 这 种 方式 研制 基于 单 摄像 机 的 立体 视觉 系统 。 

把 单 摄像 机 镜像 为 一 对 虚拟 摄像 机 ， 可 在 同一 个 CCD 像 面 上 采集 到 存在 视差 的 两 幅 图 
像 。 此 方案 中 双 摄 像 机 由 同一 台 摄 像 机 虚拟 ， 减 小 了 系统 的 体积 ， 且 虚拟 的 两 台 摄 像 机 的 工 
作 状 态 完 全 一 致 ， 因 此 解决 了 双 目 视觉 传感器 的 缺点 。 将 之 应 用 于 大 型 视觉 检测 系统 ， 如 汽 
车 白 身 视觉 检测 系统 之 中 ， 可 显著 降低 成 本 ， 减 小 系统 体积 ， 改 善 可 靠 性 和 提高 测量 速度 。 
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6.3.2 ”虚拟 立体 视觉 测量 原理 


单 摄像 机 双 目 视觉 传感器 的 测量 原理 也 是 基于 立体 视觉 测量 方法 ， 利 用 一 台 摄 像 机 和 两 
个 对 称 的 光学 反射 镜 组 成 。 其 光路 原理 如 图 6. 2 所 示 。 

利用 左右 对 称 的 两 个 光学 反射 镜 组 Mi 
与 Mn 与 Mi 与 Ms， 把 实际 摄像 机 C 镜像 
为 存在 一 定 角度 、 相 互 对 称 的 两 台 虚 拟 摄 
像 机 Cx 与 Cn。 正 对 摄像 机 的 反射 镜 组 Mi 
与 Mi 把 摄像 机 像 平 面 平 分 为 “ 左 ”、“ 右 ” 
像 面 ， 使 摄像 机 的 “ 左 ” 像 面 只 能 接收 左 
反射 光路 所 成 的 像 ， 摄 像 机 “ 右 ” 像 面 只 





pS < 入、 
能 接收 右 反 射 光路 所 成 的 像 。 被 摄 物体 通 a 人 
过 左 、 右 反射 光路 ， 分 别 成 像 在 摄像 机 的 © 


“ 左 ”、“ 右 ” 像 面 上 ,测量 时 ， 视 场 内 被 测 图 6.2 单 摄像 机 立体 视觉 传感器 光路 图 

点 在 单 摄像 机 虚拟 出 的 两 个 视 场 内 分 别 成 像 ， 形 成 一 定 虚拟 的 立体 视觉 视差 .利用 空间 点 在 
两 虚拟 摄像 机 平面 上 的 透视 成 像 点 坐标 来 求 取 空 间 点 的 三 维 坐 标 。 这 相当 于 传统 的 双 摄 像 机 
视觉 传感器 从 两 个 不 同位 置 获取 被 测 物体 的 两 幅 图 像 ， 因 此 具有 双 目 视觉 测量 功能 。 


6.3.3 ” 单 摄像 机 虚拟 立体 视觉 模型 


图 6. 3 所 示 为 镜像 式 的 虚拟 立体 视觉 结构 。 设 反射 镜 与 Mi 的 交点 为 坐标 原点 ， 水 
平方 向 的 视 场 为 X 轴 ， 垂 直方 向 的 视 场 为 Z 
轴 ， 反 射 镜 Mi 与 MW, 与 X 轴 的 夹 角 为 a， 
反射 镜 WW 与 Ws 与 X 轴 的 交点 坐标 为 
( - 工 ，0) ,Mn 与 X 轴 的 交点 坐标 (LL，0)。 
又 设 摄 像 机 投影 中 心 的 坐标 为 (0，- d) ， 
反射 镜 Ms 所 在 的 直线 方程 为 

Z = Xtan a 【6.2 ) 
Ma 所 在 的 直线 方程 为 
Z -=(X-7Z)tan8 (6.3) 
则 0 关于 Ma 的 对 称 点 O01，( O04 为 虚拟 摄像 
机 Cs 的 投影 中 心 ) 的 坐标 (XX,。，Zin) 满 
足 如 下 关系 : 





























Zi 一 Xn 
7 = 7 tana (6.4) 图 6.3 单 摄像 机 虚拟 立体 视觉 结构 示意 图 
Xir + Zir = ad (6.5) 
由 式 (6.4) 和 式 (6.5) 可 知 ，0 关于 MW; 的 对 称 点 014 的 坐标 为 ( - dsin2a,dcos2a) 。 
Or (O01 为 虚拟 摄像 机 Ci 的 投影 中 心 ) 的 坐标 ， (Xn ,Zin) 满足 如 下 关系 : 
Zr + dcos2a _ [Xn - dsin2a 
| A -Lliang (6.6) 
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Zor — dcos2a 
X + dsin2a 三 cosB (6.7) 
由 式 (6.6) 和 式 (6.7) 可 知 ，0 关 于 Wan 的 对 称 点 0 的 坐标 为 
(dsin(B - a) + 2Lsin’B,dcos2(B - a) - Lsin2B) (6.8) 


由 式 (6.8) 确定 虚拟 摄像 机 Ci 与 C4 投影 中 心 的 坐标 。 并 由 光路 反射 可 以 确定 虚拟 摄像 机 
的 摆 放 角 为 

中 =90"+2a 一 28 (6.9) 
由 式 (6.8) 和 式 (6.9) 即 可 确定 模拟 双 目 视觉 传 感 带 左 、 右 虚拟 摄像 机 的 坐标 和 摆 放 角 
度 。 并 由 式 (6.9) 可 推出 反射 镜 MW 与 Ma 的 摆 放 角度 B 必须 不 小 于 反射 镜 Mi 与 Ma 的 摆 
放 角 度 a。 当 B=a 时 ， 对 应 为 正直 摆 放 式 双 目 视 觉 传感器 。 


6. 3.4 ”系统 相关 参数 计算 


1. 反射 镜 长 度 计 算 
要 使 摄像 机 “ 左 ” 像 面具 能 接收 左 反 射 光 路 所 成 的 像 ,“ 右 ” 像 面 只 能 接收 右 反 射 光 路 
所 成 的 像 ， 系 统 不 仅 对 反射 镜 的 摆 放 和 角度、 摆 放 位 置 有 一 定 的 要 求 ， 同 时 对 反射 镜 的 长 度 也 
有 要 求 。 当 反射 镜 长 度 过 短 时 ， 将 减 小 系统 的 视 场 ， 当 反射 镜 过 长 时 ， 将 增 大 系统 的 体积 ， 
同时 加; 也 可 能 遮挡 Wi 的 光路 。 合 理 的 反射 镜 长 度 设 计 是 系统 的 最 基本 要 求 。 
设 反 射 镜 Mi 的 长 度 为 1 ， 在 三 角形 Oo4 中 ， 由 正弦 定理 可 得 
L d 
sing ~ sin(90° ~ (0 + a)) 
由 式 (6.10) 可 知 ， 反 射 镜 Mi 与 Ms 的 长 度 为 
l' = dsinO/cos(0 + a) (6.11) 
在 反射 镜 MM 长 度 已 确定 的 情况 下 ， 反 射 镜 MW 必须 能 完全 接收 从 Mi 反射 过 来 的 光线 ， 
否则 将 改变 摄像 机 的 视 场 。 设 反射 镜 Wu 的 最 短 长 度 为 1 ， 在 人 0BC 及 AO CD 中 ， 由 正 
弦 定 理 有 











(6. 10 ) 











L oC 
sin(90° +B -2a) ~ sin(180° -B) (6. 12) 
oC +d ee 
sin(90° +B ~ 2a -0) sing (6. 13) 
由 式 (6. 12) 和 式 (6. 13) 可 得 ,反射 镜 Mn 的 最 短 长 度 为 
1 LsinBsin0 
~ cos(B -2a -0) cos(B - 2a) + dsing| (6. 14) 


2. 基线 距离 B 的 计算 
单 摄像 机 虚拟 立体 视觉 的 基线 距离 是 两 个 虚拟 摄像 机 光学 中 心 (Xj ,Zi) 和 (和 
Za) 之 间 的 距离 ， 因 此 基线 距离 为 
B = 2X,, = 2dsin(2(B - a)) + 4Lsin’B (6. 15 ) 
从 式 (6.15) 可 以 看 出 ， 基 线 距离 由 四 个 因素 决定 : 光学 反射 镜 的 摆 放 角度 和 B、 摄 
像 机 光学 中 心 的 Z 轴 坐 标 4d 及 有 Ws 与 X 轴 交 点 的 坐标 L。 在 d 与 工 一定 的 情况 下 ， 改 变 反 射 
镜 的 摆 放 角度 ， 即 可 获得 测量 精度 所 要 求 的 基线 距离 和 虚拟 摄像 机 的 摆 放 和 角度， 而 立体 视觉 
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系统 的 体积 没有 明显 增 大 。 


6.4 结构 光 视 觉 测量 法 


结构 光 视 觉 测 量 法 是 一 种 常用 的 直接 获取 深度 信息 的 方法 ， 最 早出 现 于 20 世纪 70 年 
代 ， 是 为 了 解决 立体 视觉 中 图 像 匹配 的 难题 而 提出 的 。 结 构 光 视觉 测量 法 是 利用 辅助 的 投影 
光 、 人 为 地 构造 易于 被 机 器 所 识别 的 特征 。 基 于 光学 双 摄 像 机 三 角 测 量 的 原理 ， 将 双 摄像 机 
交会 中 的 某 一 台 摄 像 机 用 事先 约定 好 的 结构 投影 光 代 替 ， 利 用 投影 系统 和 成 像 系 统 的 几何 信 
息 进行 三 维 样 貌 的 测量 ， 就 是 结构 光 三 维 视觉 测量 法 。 相 比 双 目 视觉 系统 ， 结 构 光 三 维 视 觉 
测量 法 是 一 种 主动 视觉 系统 ， 它 有 量程 广 、 视 场 大 、 精 度 较 高 、 光 条 或 结构 光 特征 图 像 信息 
提取 简单 、 实 时 性 强 及 主动 受 控 等 特点 ,但 是 其 缺点 是 易 受 光照 干扰 。 因 此 ， 适合 在 室内 场 
合 ， 主 要 用 于 零 部 件 的 逆向 工程 、 质 量 检测 ， 数 字 化 文物 ， 以 及 整形 医疗 等 领域 。 目 前 ， 结 
构 光 三 维 视觉 测量 法 的 研究 主要 集中 在 结构 光 投 射 模式 、 子 像素 级 的 光 条 中 心 提 取 和 处 理 算 
法 及 标定 方法 等 方面 。 


6.4.1 系统 构成 


结构 光 三 维 视觉 系统 基于 光学 的 三 角 法 测量 原理 ， 如 图 6.4 所 示 。 其 中 ， 光 学 投射 器 
(常用 激光 器 和 投影 仪 ) 将 一 定 模式 的 结构 光 投射 于 物体 的 表面 ， 在 表面 形成 由 被 测 物体 表 
面 形状 所 调制 的 空间 编码 三 维 图像 。 该 三 维 图 像 由 处 于 光学 投射 器 

另 一 位 置 的 摄像 机 摄取 ， 从 而 获得 空间 编码 的 二 维 畸 变 。 摄像 机 
图 像 。 其 畸变 程度 取决 于 光学 投射 器 与 摄像 机 之 间 的 相 
对 位 置 和 物体 表面 形 廓 (高度) 。 直 观 上 ， 沿 投影 光 显 
示 出 的 位 移 (或 偏 移 ) 与 物体 的 高 度 成 比例 ， 扭 结 表示 
了 平面 的 变化 ， 不 连续 显示 了 表面 的 物理 间隙 。 当 光学 
投射 器 与 摄像 机 之 间 的 相对 位 置 一 定时 ， 由 畸变 的 二 维 
空间 编码 图 像 坐标 便 可 重 现 物体 表面 的 三 维 形 廊 。 结 构 
光 三 维 视觉 测量 系统 由 光学 投射 器 、 摄 像 机 和 计算 机 系 图 6.4 结构 光 三 维 视觉 测量 系统 
统 三 部 分 构成 。 

6. 4. 2 ”数学 模型 


如 图 6.5 所 示 ， 设 待 求 物 点 在 世界 坐标 系 中 的 坐标 是 (x,，y, ，z,) ， 在 图 像 上 与 其 对 
应 点 的 坐标 是 (x;，y;) ， 待 求 物 点 和 对 应 点 之 间 的 关系 为 





























计算 机 系统 
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WinXi Cy Co Cs Cu 
J 

Wiyil= iC Cy Cy Ca (6. 16) 
> 人 

Wi Ca Ca C3 Ca 





这 里 ,(C;) 3 为 摄像 机 参数 矩阵 ， 可 利用 综合 参数 法 经 校准 定 出 。 
类 似 地 ， 待 求 物 点 (x,，y,，z,) 和 对 应 的 投影 仪 坐标 (x,，y,) 之 间 的 关系 可 形式 地 
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表示 为 
waxs] FTP Ps Ps Pal™ 
wy l= |Pp, Ps Ps Ps” 
wy Pp, P, Ps Py > 
(6.17) 


式 中 ,，(P,)3.4 为 投影 仪 参数 和 矩阵。 但是， 由 于 
除了 光 点 投影 法 之 外 ， 在 上 述 各 种 编码 方案 中 
y 均 是 未 知 的 ， 故 应 用 这 些 方法 进行 测量 时 只 
能 利用 如 下 的 方程 ; 














NX 
[es > 忆 Py 加 yw 
Wo Pa P;, Ps Pa Zw 
1 
(6. 18) 图 6.5 结构 光 视 觉 测量 示意 图 
对 式 (6. 18) 中 的 投影 仪 参数 矩阵 第 二 行 的 各 参数 的 下 标 重 新 进行 标记 ， 有 
2 
be bb Py, Ps | Wy (6. 19) 
Won P, 己 2 忆 3 Pa Zw 
1 


式 中 ， 投 影 仪 参数 和 矩阵 (P;),s 可 用 稍 后 给 出 的 校准 算法 定 出 。 
下 面 讨论 如 何 根 据 对 空间 投影 的 编码 结果 和 观测 图 像 来 进行 物 点 三 维 坐 标的 计算 。 由 式 
(6.16) 可 得 





Win = CaXys + Coy + Cazs + Ca (6. 20) 
将 其 代入 (6.16) 的 前 两 个 方程 中 ， 并 对 结果 加 以 整理 ， 得 到 
(Ci -Cayi)xzw + (Cy — Caoyi)yv +( Ca — C3)i)z, = Cayi 一 Co4 (6. 21 ) 
(Cu — Caxi)xs + (Co — Cyri)ys +( Ca — Cari)z, = CaxXi — Ci (6. 22) 
另外 ,由 式 (6. 17) 可 得 
Wph = Px, + Pyy, + Pz, + Co (6. 23) 


将 其 代入 式 〔6.17) 的 第 一 个 方程 中 ， 并 对 结果 加 以 整理 ， 得 到 
(Pa - Pyix, )Xw + (Pi, — Pyx, )yw + (Pi — ax )z, = Pyx, — Pu (6.24) 
将 上 述 结果 写成 矩阵 形式 ， 即 




















COY = 下 (6. 25 ) 
这 里 V = [xywzv]” 
F-= [Ce = CC = Co Py, = Pir) 
CI — Cax;: Ci — Cyx; C13 — Cas%; 
Q= | C.-Cay Cy -Coy Cy — Cy 
Pi — Pix, Pi, — Py,x%, Pi, — Ps%, 
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若 和 矩阵 8 是 可 逆 和 矩阵 ， 则 待 求 物 点 的 三 维 坐标 为 

7 = OF (6. 26 ) 
显然 ， 对 于 空间 投影 的 编码 图 像 上 的 每 一 个 像 点 ， 均 可 以 按 上 述 计 算 相 应 物 点 在 世界 坐 
标 系 下 的 坐标 值 。 若 将 上 述 各 物 点 在 世界 坐标 系 下 的 X、7、 2 坐标 分 量 值 分 别 作为 像素 值 
存 人 一 幅 图 像 中 ， 则 将 得 到 三 幅 这 样 的 图 像 。 把 这 些 图 像 称 之 为 距离 图 像 。 


6.4.3 影 模式 


1. 光 点 投影 法 

如 图 6. 6 所 示 ， 考 虑 有 投影 仪 沿 (x,，y,) 方向 投射 一 线 状 光束 到 待 测 物体 上 的 情形 。 
此 时 ， 者 用 摄像 机 从 另 一 方向 对 待 测 物体 进 行 观测 ， 将 会 发 现在 待 测 物体 被 照射 到 的 地 方 昭 
射 前 后 的 图 像 灰 度 将 有 一 个 明显 的 差别 。 即 被 照射 处 照射 后 的 图 像 灰 度 将 变 亮 ， 相 比 之 下 其 
他 地 方 照 射 前 后 的 图 像 灰 度 则 变化 甚 微 。 因 此 ， 若 将 照射 后 的 观测 图 像 同 照射 前 的 观测 图 像 
相 减 ， 则 在 被 照射 处 其 图 像 灰 度 的 差 值 将 为 一 大 的 正 数 ， 而 在 其 他 地 方 其 差 值 的 绝对 值 则 近 
乎 为 零 。 这 样 ， 通 过 一 个 简单 的 阔 值 操作 可 从 观测 图 像 上 将 由 上 述 线 状 光束 〈 可 理想 化 为 
空间 中 的 一 条 直线 ) 在 物体 表面 上 形成 的 光 点 (对 应 于 物 点 ) 所 对 应 的 像 点 (可 理想 化 为 
一 个 点 ) 抽取 出 来 。 显 然 ， 由 透视 变换 关系 可 知 ， 连 接 上 述 物 点 和 像 点 的 直线 即 为 对 应 于 
像 点 的 视线 。 由 于 所 投影 的 线 状 光束 和 光 点 之 间 的 对 应 关系 是 已 知 的 ， 故 由 处 于 空间 中 同一 
平面 上 的 两 条 非 平行 直线 可 惟一 地 确定 该 平面 上 的 一 点 ， 待 求 物 点 的 三 维 位 置信 息 可 由 上 述 
投影 光束 所 确定 的 直线 和 对 应 于 像 点 的 视线 在 空间 中 的 交点 所 给 出 。 



























































投 光 图 像 无 投 光 图 像 











图 6.6 光 点 投影 示意 图 
利用 该 方法 确定 物 点 三 维 信息 的 方法 的 优点 是 处 理 简单 、 可 靠 ， 缺点 是 需要 用 光 点 对 待 
测 物 体 进行 二 维 扫 描 ， 以 逐 点 得 到 整 幅 图 像 上 各 像 点 所 对 应 的 物 点 的 三 维 信息 。 由 于 该 方法 
为 了 检测 出 图 像 中 的 一 个 光 点 以 得 到 该 点 所 对 应 的 测量 数据 ， 需 对 整 幅 图 像 进行 处 理 ， 导 致 
测量 时 间 过 长 ， 不 能 满足 某 些 对 实时 性 要 求 高 的 应 用 需求 。 此 时 ， 可 以 考虑 采用 在 待 测 物体 
上 投影 点 阵 光 以 实现 快速 测量 。 但 是 ， 作 为 代价 要 再 度 面临 所 谓 求 对 应 的 老 问 题 。 
交点 投影 法 中 所 使 用 的 投影 仪 一 般 可 由 具有 二 维 扫描 机 能 的 点 激光 源 所 充任 。 
2. 光 条 投影 法 
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该 方法 是 光 点 投影 法 的 一 个 扩张 ， 如 图 6.7 所 示 ， 考 虑 由 投影 仪 沿 x, 所 定义 的 狭 缝 方 
向 将 在 空间 中 呈 平 面 状 分 布 的 光 投 射 到 待 测 物体 上 的 情形 。 此 时 ， 若 用 摄像 机 从 男 一 个 方向 
对 待 测 物体 进行 观测 ， 将 会 发 现 和 前 述 投影 线 状 光 的 情形 一 样 ， 在 被 照射 处 照射 前 后 的 图 像 
灰 度 将 有 一 个 明显 的 差别 ， 即 被 照射 处 的 图 像 灰 度 将 变 亮 。 相 比 之 下 ， 其 他 地 方 照射 前 后 的 
图 像 灰 度 则 变化 很 小 。 因 此 ， 大 将 照射 后 的 观测 图 像 同 照射 前 的 观测 图 像 相 减 ， 则 被 照射 处 
的 图 像 灰 度 的 差 值 将 是 一 个 很 大 的 正 数 ， 而 在 其 他 部 分 的 差 值 的 绝对 值 则 近乎 为 零 。 这 样 ， 
通过 一 个 简单 的 冰 值 操作 ， 可 从 观测 图 像 上 将 上 述 狭 颖 光 〈 可 理想 化 空间 中 的 一 个 平面 ) 
在 物体 表面 形成 的 光 条 (可 理想 化 为 一 条 直线 ) 所 对 应 的 图 像 区 域 抽取 出 来 。 由 于 所 投射 
的 狭 颖 光 和 物体 表面 上 的 光 条 之 间 存 在 已 知 的 对 应 关系 ， 故 由 空间 中 的 一 个 平面 和 一 条 与 之 
非 平行 的 直线 可 以 惟一 地 确定 空间 中 的 一 点 的 。 图 像 中 待 求 物 点 的 三 维 位 置信 息 可 用 上 述 狭 
颖 光 在 空间 中 形成 的 平面 和 对 应 于 像 点 的 视线 在 空间 中 的 交点 所 给 出 。 
二 维 扫描 



































投 光 图 像 无 投 光 图 像 
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摄像 机 二 值 图 像 


图 6.7 光 条 投影 示意 图 

利用 该 方法 确定 物 点 三 维 信息 的 优点 是 明显 的 。 此 法 不 仅 处 理 简单 、 可 靠 ， 而 且 由 一 次 
投影 操作 可 以 得 到 光 条 上 所 有 物 点 处 的 三 维 信息 ， 测 量 速度 比 线 状 光 投 影 法 要 快 。 但 是 ， 要 
得 到 整个 物体 的 三 维 位 置信 息 ， 需 要 用 光 条 对 待 测 物体 进行 一 维 扫描 。 也 就 是 说 ， 需 要 控制 
狭 颖 光 的 方向 以 保证 使 投射 的 光 条 能 够 扫 过 整个 待 测 物体 。 

光 条 投影 法 中 所 使 用 的 投影 仪 主要 采用 以 下 几 种 工作 方式 ; 

(1) 机 械 扫 描 方式 

例如 ， 如 图 6. 8a 所 示 ， 将 点 激光 所 发 射 的 激光 束 经 柱 面 镜 后 变 成 平面 激光 ， 照 射 到 受 
控 的 平面 镜 上 ， 然 后 经 平面 镜 在 测量 空间 形成 所 需要 的 照射 到 被 测 物体 上 的 平面 光 。 相 应 的 
平面 镜 一 般 安放 在 具有 机 械 扫描 功能 的 装置 上 。 

(2) 电子 扫描 方式 

如 图 6. 8b 所 示 ， 光 源 前 放置 了 掩 膜 ， 该 掩 腊 上 有 疾 颖 状 光栅 。 通 过 计算 机 控制 狭 缝 状 
光栅 的 开 闭 状态 可 形成 所 需要 的 、 用 于 照射 被 测 物 体 的 平面 光 。 由 于 采用 电子 扫描 ， 避 人 免 了 
机 械 扫描 方式 的 缺点 。 例 如 ， 它 具有 更 灵活 的 扫描 方式 ， 可 以 按 任 意 编制 的 顺序 打出 平面 
光 ， 也 可 以 同时 打出 多 个 平面 光 。 

3. 灰 度 编码 模式 光 投 影 法 
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a) 机 械 扫描 b) 电子 扫描 
图 6.8 光 条 投影 法 

在 光 条 投影 法 中 ， 通 过 先 向 待 测 物 体 投射 方向 已 知 的 狭 缝 光 ， 然 后 观测 相应 的 光 条 来 建 
立 由 狭 缝 光 形 成 的 平面 与 光 条 上 的 光 点 所 对 应 的 视线 之 间 的 对 应 关系 。 由 于 什么 时 候 在 哪个 
方向 上 投射 狭 缝 光 是 预知 的 ， 故 上 述 做 法 可 以 理解 为 是 以 建立 投射 狭 缝 光 的 时 间 序 列 的 方式 
对 测量 空间 的 一 种 编码 。 上 述 利用 时 间 - 空 间 之 间 的 对 应 关系 的 编码 方式 是 易于 理解 的 ， 也 
是 非常 实用 的 。 但 是 ， 这 种 编码 方式 并 不 是 在 所 有 情况 下 都 是 行 之 有 效 的 。 例 如 ， 当 物体 和 
测量 系统 之 间 存 在 相对 运动 时 ， 这 种 编码 方式 就 会 遇 到 困难 。 此 时 ， 有 必要 寻求 其 他 更 为 合 
适 的 编码 方式 。 事 实 上 ， 除 了 上 面 提 到 的 利用 时 间 - 空 间 之 间 的 对 应 关系 的 编码 方式 之 外 ， 
还 存在 其 他 一 些 编码 方式 。 例 如 ， 通 过 向 待 测 物体 投射 经 过 灰 度 或 是 彩色 编码 的 模式 光 同 样 
可 以 达到 对 测量 空间 进行 编码 的 目的 。 为 叙述 方便 ， 把 通过 向 待 测 物 体 投射 经 过 灰 度 ( 彩 
色 ) 编码 的 模式 光 以 实现 三 维 视觉 测量 的 方法 简称 为 灰 度 (彩色 ) 编码 模式 光 投 影 法 。 下 
面 ， 对 灰 度 编码 模式 光 投 影 法 作 一 个 简单 的 介绍 。 

如 图 6. 9 所 示 ， 在 投影 仪 光 源 
的 前 方 放置 一 个 掩 膜 。 其 中 ， 掩 膜 
上 由 %, 所 定义 的 狭 颖 处 的 透 光 率 
为 fx,) 。 如 果 适 当选 择 f(x,) 的 
值 [ f(x,) 一 般 取 为 单 值 函 数 ， 如 
fx,) 取 为 定义 在 某 个 灰 度 区 间 上 
的 线性 函数 ] ， 使 不 同 的 x, 所 对 应 
的 f(x,) 的 取 值 各 不 相同 〈 即 不 同 
狭 颖 处 的 透 光 率 各 不 相同 ) 。 那 么 
当 投 影 仪 经 由 这 样 一 个 掩 膜 向 待 测 
物体 投 光 时 ， 投 射 到 待 测 物 体 上 的 投影 仪 。 ”摄像 机 其 分 交代 
光 的 强度 将 随 狭 颖 光 方 向 的 变化 而 
变化 ， 从 而 完成 对 测量 空间 的 编 
人 码 。 这 里 ,投射 在 由 x, 所 确定 的 狭 颖 光 和 物体 表面 的 交 线 上 的 光 的 强度 将 与 /(x,) 成 正比 。 
若 用 摄像 机 从 另 一 方向 对 待 测 物体 进行 观测 ， 将 会 发 现 照射 前 后 待 测 物体 的 图 像 灰 度 将 有 所 
不 同 。 其 差 值 与 入 射 光 所 在 的 狭 颖 方向 %, 处 的 透 光 率 f(x,) 成 正比 。 显 然 ， 上 述 差 分 图 像 上 
的 等 灰 度 线 上 的 各 个 像 点 所 对 应 的 物 点 受到 来 自 同一 个 狭 颖 处 的 平面 光 的 照射 。 若 忽略 物体 
表面 各 点 反射 特性 的 不 同 ， 则 根据 所 观测 到 的 上 述 差分 图 像 上 各 像 点 的 灰 度 取 值 可 以 确定 与 












































投 光 图 像 无 投 光 图 像 











图 6.9 灰 度 编码 模式 光 投 影 法 
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相应 像 点 相对 应 的 狭 缝 光 。 接 下 来 的 处 理 过 程 和 光 条 投影 法 类 似 ， 图 中 待 求 物 点 的 三 维 位 置 
言 息 可 用 上 述 狭 缝 光 在 空间 中 形成 的 平面 和 对 应 于 像 点 的 视线 在 空间 中 的 交点 得 出 。 为 叙述 
方便 ， 将 由 摄像 机 方向 观测 到 的 上 述 差分 图 像 称 为 空间 编码 图 像 。 

利用 该 方法 确定 物 点 三 维 信息 的 优点 是 ， 只 需 进行 一 次 投影 即 可 得 到 图 像 上 各 像 点 的 空 
间 编 码 值 。 该 方法 特别 适用 于 在 测量 过 程 中 待 测 物体 存在 抖动 的 情况 。 但 是 ， 该 方法 的 缺点 
是 明显 的 。 主 要 表现 在 以 下 几 个 方面 ; 

1) 需要 高 为 5/ 玉 的 图 像 传感器 。 

2) 易 受 物体 本 身 反 射 特性 的 影响 。 

3) 易 受 环境 背景 光 的 影响 。 

4) 易 受 物体 间 存 在 的 相互 反射 的 影响 。 

为 了 克服 上 述 缺 点 ， 需 要 采取 某 些 补偿 措施 。 但 是 限于 目前 的 技术 条 件 ， 即 使 采用 补偿 
手段 ， 一 般 也 难以 得 到 高 的 测量 精度 。 

4. 组 合式 二 值 编 码 模 式 光 投影 法 

考虑 单 次 使 用 光 条 投影 法 进行 三 维 测 量 的 例子 。 从 原理 上 来 看 ， 光 条 投影 法 可 以 认为 是 
前 述 灰 度 编码 模式 光 投 影 法 的 一 个 特例 。 由 于 投射 到 待 测 物体 上 的 光 的 强度 仅 取 分 别 对 应 于 
狭 终 开 、 闭 两 种 状态 的 “有 光 ” (一 般 取 为 系统 所 能 提供 的 最 大 灰 度 ) 和 “无 光 ” (一般 取 
为 0) 两 种 灰 度 值 ， 故 该 方法 克服 了 灰 度 编码 模式 光 投影 法 的 主要 缺点 ， 具 有 抗 干扰 能 
强 、 受 物体 本 身 的 反射 特性 影响 小 等 优点 。 但 是 ， 这 种 方法 也 有 其 自身 的 缺点 ， 即 一 次 测量 
仅 能 得 到 相应 光 条 位 置 处 的 三 维 信息 。 

在 此 基础 上 ， 引 入 一 种 新 的 测量 方法 。 该 方法 将 上 述 光 条 投影 法 和 灰 度 编码 模式 光 投 影 
法 两 种 方法 进行 组 合 以 克服 各 自 方法 中 存在 的 缺点 ， 同 时 尽 可 能 保留 各 自 方法 的 优点 。 这 个 
方法 便 是 所 谓 的 组 合式 二 值 编 码 模式 光 投 影 法 。 


该 方法 借助 于 图 6. 10 上 图 所 示 的 一 组 
掩 膜 来 实现 对 整个 测量 空间 的 编码 。 这 里 ， | 国 i Ml | 
每 个 掩 膜 各 狭 缝 处 的 透 光 率 仅 有 “1” 和 掩 膜 A 掩 膜 B 扼 膜 C 

“0” 两 种 可 能 取 值 。 实 际 测量 时 ， 依 次 将 
经 由 上 述 拖 膜 产生 的 模式 光 投 向 待 测 物体 ， 
以 完成 对 测量 空间 的 编码 从 而 建立 投影 光 


和 观测 像 点 之 间 的 对 应 关系 。 首 先 ， 将 经 0 (0 
由 第 一 个 掩 膜 所 产生 的 模式 光 投向 待 测 物 4 hh PE 


体 。 经 过 和 光 条 投影 法 中 所 进行 的 类 似 处 2 
投影 仪 



























































理 (图 像 差 分 + 取 阔 值 操作 ) 后 ， 如 图 

6. 10 下 图 所 示 ， 可 将 整个 测量 空间 划分 为 摄像 机 

有 光 和 无 光 两 种 区 域 。 对 于 有 光 区 域 而 言 ， 图 6. 10 组 合式 二 值 编码 模式 光 投影 法 

赋予 其 编码 值 “1”。 而 对 于 无 光 区 域 而 言 ， 则 赋予 其 编码 值 “0”。 这 样 ， 经 过 以 上 操作 ， 
可 用 1bit 完成 对 测量 空间 的 一 次 “ 粗 ” 编 码 ， 得 到 相应 的 1bit 编码 图 像 。 如 图 6. 11a 所 示 ， 
整个 测量 空间 的 形状 为 一 四 角 锥 。 用 1bit 按 上 述 方式 对 整个 空间 进行 编码 ， 实 际 上 相当 于 把 
测量 空间 分 解 成 两 个 不 相交 的 子 空间 。 这 些 子 空间 的 形状 仍 为 四 角 锥 ,但 横向 有 收缩 。 这 
样 ， 对 于 空间 中 的 一 个 物 点 而 言 ， 若 经 过 上 述 处 理 ， 该 点 所 对 应 的 像 点 获得 了 编码 值 “1”， 
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则 表明 相应 的 物 点 位 于 图 6. 11a 所 示 的 白色 标记 的 子 空 间 内 ， 和 否则 位 于 灰 度 标记 的 子 空间 
内 。 同 理 ， 可 将 第 二 个 掩 膜 产生 的 模式 光 投 向 待 测 物体 ， 并 经 过 与 上 述 处 理 类 似 的 过 程 用 
lbit 完成 对 测量 空间 的 又 一 次 “ 粗 ” 编 码 。 该 次 “ 粗 ” 编 码 的 结果 也 把 整个 测量 空间 按照 
图 6. 11b 所 示 的 模式 分 解 成 两 个 不 相交 的 子 空 间 。 相 应 地 ， 可 以 得 到 另 一 幅 关 于 测量 空间 的 
1bit 编码 图 像 。 类 似 地 ， 对 于 空间 中 的 一 个 物 点 而 言 ， 若 该 点 所 对 应 的 像 点 在 编码 过 程 中 获 
得 了 编码 值 “1”， 则 表明 相应 的 物 点 位 于 图 6. 11b 中 由 白色 标记 的 子 空间 内 ， 否 则 位 于 灰 
度 标 记 的 子 空间 内 。 现 在 ， 考 虑 如 何 对 前 两 次 投影 情况 下 得 到 的 “ 粗 ” 编 码 图 像 进 行 组 合 ， 
以 获得 关于 测量 空间 的 较 精 细 的 编码 结果 。 具 体 做 法 如 下 ， 以 前 面 的 编码 过 程 中 得 到 的 两 幅 
1bit 编码 图 像 为 基础 ， 生 成 一 幅 深 度 为 2bit 的 编码 图 像 。 其 中 ， 该 2bit 编码 图 像 的 最 高 位 的 
比特 面 为 投影 第 一 so 
投影 第 二 个 掩 膜 所 对 应 的 模式 光 下 所 获得 的 1bit 编码 图 像 。 上 述 处 理 之 后 ， 如 图 6. 11e 
所 示 ， 整 个 测量 空间 等 价 地 被 分 解 成 2? 个 不 相交 的 子 空 人 
部 分 所 示 。 这 样 ， 根 据 空 间 中 一 个 物 点 所 对 应 的 像 点 在 上 述 2bit 编码 图 像 中 所 取 的 编码 值 ， 
可 以 推断 该 物 点 的 空间 位 置 。 例 如 ， 当 一 个 像 点 具有 编码 值 (例如 10) 时 ， 可 知 该 像 点 所 
对 应 的 物 点 落 在 图 6. 11c 中 由 编码 值 (10) 所 标记 的 子 空间 内 。 

对 于 不 同 的 掩 膜 不 断 重复 上 1 0 
述 的 处 理 过 程 ， 可 以 得 到 关于 测 
量 空间 的 更 为 精细 的 编码 结果 。 
这 样 ， 经 过 n 次 投 光 后 ， 将 得 到 
一 深度 为 n hit 的 空间 编码 图 像 。 
相应 地 ， 整 个 测量 空间 被 分 解 成 
2" 个 子 空间 。 每 个 子 空间 均 为 一 
个 形状 呈 刀 刃 状 的 四 角 锥 。 显 然 ， a) 
! 值 越 大 ， 上 述 四 角 锥 ( 即 分 解 子 图 6.11 编码 示例 
空间 ) 的 刀 背 部 分 在 空间 的 散 开 
程度 越 小 ， 编 码 的 精度 越 高 。 只 要 nn 足够 大 ， 则 相应 的 刀刃 状 分 解 子 空间 在 空间 的 散 
开 程 度 就 足够 小 ， 以 至 于 每 一 个 分 解 子 空间 均 可 由 空间 中 的 一 个 平面 来 近似 。 从 效果 上 来 
看 ， 这 样 得 到 的 分 解 子 空 > 投影 法 中 狭 颖 光 所 占据 的 空间 区 域 。 所 不 同 的 
是 ,在 提供 同样 的 空间 分 辨 率 的 情况 下 ， 光 条 投影 法 所 需要 投影 的 次 数 远 比 现在 的 方法 多 。 
例如 ， 当 把 测量 空间 分 解 成 2" 个 子 空间 ， 用 光 条 投射 法 共 需 投影 2" 次 ， 而 用 现在 的 方法 
( 即 组 合式 二 值 编码 模式 光 投 影 法 ) 则 仅 需 投影 lb2” = 次 ， 大 大 减少 了 所 需要 的 投影 次 数 。 


6.4.4 标定 方法 
投影 仪 参数 可 借助 于 基准 物体 和 摄像 机 进行 校准 。 为 此 ， 对 式 (6.19) 进行 改写 ， 可 







































































































































































时 
Pix, + Poys + Pazy + Pi -Pixxv -Poxyv -Paxizv — Paax, = 0 (6. 27 ) 
若 对 应 的 物 点 为 一 基准 参考 点 ， 则 式 (6.27) 可 作为 求解 所 述 投 影 仪 参数 的 一 个 约束 
条 件 。 现 在 ， 待 求 的 未 知 参数 共 8 个 。 因 此 ， 如 果 已 知 不 在 同一 平面 上 的 8 个 基准 点 的 三 维 
坐标 及 其 对 应 的 投 要 区 仪 坐 标 ， 则 利用 式 (6. 17) 可 解 出 待 求 的 投影 仪 参数 。 注 意 ， 上 面 8 
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个 参数 不 是 相互 独立 的 ， 其 中 有 1 个 可 任意 设置 。 比 如 ， 可 取 P =1。 与 摄像 机 参数 的 校准 
过 程 一 样 ， 为 了 提高 校准 精度 ， 可 采用 8 个 以 上 的 基准 点 。 当 采用 NN 个 基准 点 时 ， 有 





Ny yw Zw 1 一 %wl1XPpl 一 ywiXpl ZwlXpl Pi Xpl 
Xo yo Za 1 XNXp 一 JoXp 一 ZiD2Xp2 P, Xp2 

= (6. 28) 
Koy yww Zw 1 一 YYwNXPN TYwXpy 一 SwNXpN Ps» XpN 


这 里 ,第 j(j = 1,2,…,N) 个 基准 点 在 世界 坐标 系 下 的 坐标 及 所 对 应 的 投影 仪 坐标 分 别 
用 (XY 2 ) 和 x 表示 。 记 为 


Nl ywl Zl 1 3 XwlXpl Y wiXpl SwlXpl 
B ee NX yw Zw 1 MDYXp2 至 ] 2Xp2 ps Zw2Xp2 
MXwN Vw 3SwN 1 去 MXwNXpN 宇 丽 wNXPpN nn ZwNXpN 
= T 
P=[P, P, : Pa] 
i TT 
X th [xn Xp 0 XpN ] 


则 利用 最 小 二 乘法 ， 可 解 出 





P=(B'B) BX (6. 29) 

因此 ， 由 上 述 推导 过 程 可 知 ， 对 投影 仪 参数 进行 校准 
的 关键 是 确定 所 使 用 的 各 个 基准 点 在 世界 坐标 系 下 的 坐标 
及 所 对 应 的 投影 仪 坐 标 。 获 取 这 些 量 的 方法 很 多 ， 其 中 一 
个 方法 是 借助 摄像 机 和 基准 参考 物体 ， 主 要 步 又 如 下 : 

1) 依次 对 图 6. 12 所 示 的 基准 立方 体 投 射 经 空间 编码 
的 模式 光 ， 并 运用 图 像 处 理 方法 抽取 和 记录 观测 图 像 各 像 
点 所 对 应 的 投影 仪 坐 标 。 

2) 检测 图 6. 12 所 示 的 基准 立体 上 的 各 组 直线 段 ， 并 
以 此 为 基础 ， 确 定 图 6. 12 所 示 虚 线 标 出 的 各 组 直线 段 。 由 
于 图 中 用 实 线 标 出 的 各 组 直线 段 之 间 的 交点 处 的 世界 坐标 
是 已 知 的 ， 故 利用 它们 可 以 计算 图 中 用 虚线 标 出 的 各 组 直 
线段 之 间 的 交点 处 的 世界 坐标 。 

3) 将 图 6. 12 所 示 虚 线 标 出 的 各 组 直线 段 之 间 的 交点 作为 基准 参考 点 ， 利 用 在 1) 和 
2) 中 分 别 得 到 的 基准 点 在 世界 坐标 系 和 投影 仪 坐标 下 的 坐标 值 ， 由 式 (6. 29) 得 出 待 求 的 
投影 仪 参数 。 


6.5 光 笔 式 三 维 坐 标 测量 方法 


三 坐标 测量 方法 以 其 通用 性 强 、 测 量 范围 大 、 测 量 精度 高 、 易 于 柔性 制造 和 易于 与 计算 
机 集成 制造 系统 相连 接 等 特点 ， 成 为 一 种 高 效 的 精密 测量 仪器 ， 可 广泛 应 用 于 机 械 制 造 、 电 
子 、 汽 车 制造 和 航空 航天 等 工业 领域 中 。 现 有 的 三 坐标 测量 机 ( Coordinate Measuring Ma- 
chine，CMM) 绝 大 部 分 是 接触 式 的 ， 以 正 交 坐标 系 为 基础 ， 有 固定 的 工作 台 和 互相 垂直 的 





























图 6. 12 ”基准 物体 和 世界 坐标 系 
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运动 轴 及 标尺 。 其 底座 、 工 作 合 、 导 轨 和 立柱 通常 由 金属 制 成 ， 因 此 现 有 的 三 坐标 测量 机 都 
比较 笨重 ， 不 适应 大 型 工件 现场 快速 测量 的 需要 。 

近年 来 ， 以 CCD 摄像 机 为 核心 部 件 的 三 维 视觉 检测 系统 的 研究 得 到 了 较 大 发 展 ， 由 于 
是 非 接触 式 测 量 ， 所 以 能 对 柔性 和 易 变形 件 进行 检测 。 一 旦 系统 安装 并 标定 好 后 ， 就 能 够 快 
速 检测 。 但 是 在 生产 和 科学 研究 实践 中 ， 有 很 多 场合 需要 安装 简单 、 易 于 操作 和 大 量程 的 便 
携 三 维 坐标 测量 装置 。 如 大 型 工程 项 目的 相对 位 置 测量 ， 不 可 能 把 笨重 的 机 器 搬 到 三 坐标 测 
量 机 上 进行 测量 ， 而 三 维 视觉 测量 需 对 系统 进行 复杂 的 标定 并 构筑 一 定 的 坐标 系统 。 这 些 都 
是 非常 费时 费事 的 。 针 对 上 述 问题 ,满足 现场 测量 需求 的 便携 式 三 坐标 测量 系统 及 方法 应 运 
而 生 ， 并 成 为 测量 领域 的 研究 热点 之 一 。 

先进 制造 业 的 蓬勃 发 展 对 三 维 几何 斥 才 测量 技术 提出 了 更 高 的 要 求 ， 即 实现 大 范围 、 便 
携 式 、 数 字 化 、 无 导轨 、 动 态 实时 跟踪 测量 等 。 以 单 目 或 双 目 视觉 测量 技术 为 基础 ， 结 合 三 
坐标 测量 机 (CMM) 的 工作 模式 ， 一 种 手持 光 笔 式 三 坐标 测量 机 应 运 而 生 。 它 以 测量 范围 
大 、 和 柔性 好 、 便 携 式 等 特点 在 工业 现场 测量 等 场合 有 着 广泛 的 应 用 前 景 。 仅 由 一 文 光 笔 、 一 
台 和 几 人 台 摄 像 机 及 计算 机 构成 。 把 摄像 机 架 在 待 测 物体 旁边 ， 用 光 笔 触 点 接触 物体 上 任何 感 
兴趣 的 点 ， 即 可 实时 采集 、 计 算 和 显示 这 些 点 的 三 维 坐 标 。 光 笔 式 三 坐标 测量 系统 具有 如 下 
村 点 : 

(1) 测量 功能 强大 

光 笔 式 三 坐标 测量 能 实时 动态 地 给 出 测量 范围 以 内 三 维 空间 任意 被 测 点 的 三 维 坐标 ， 
一 个 功能 完整 的 三 维 坐 标 测量 系统 。 它 既 能 完成 单一 几何 要 素 的 尺寸 与 形状 误差 的 测量 ， 
能 完成 关联 要 素 的 位 置 误差 测量 等 多 种 功能 。 

(2) 便于 携带 

与 传统 的 三 坐标 测量 设备 相 比 ， 整 个 测量 系统 的 结构 简单 轻便 ， 因 此 可 以 携带 到 室外 或 
工作 现场 进行 现场 测量 。 

(3) 量程 大 、 精 度 高 

光 笔 式 三 坐标 测量 系统 的 测量 空间 范围 可 达到 米 级 ， 而 测量 精度 可 达到 0. Imm 级 ， 因 
此 它 可 以 用 作 汽 车 车 身 、 航 天 带 壳 体 等 大 型 三 维 曲 面 的 测量 

(4) 组 建 灵活 、 操 作 简单 

光 笔 、 摄 像 机 和 被 测 物体 三 者 之 间 不 需要 严格 精确 地 安装 定位 ， 因 此 可 根据 被 测 物体 的 
特点 灵活 调整 摄像 机 的 位 置 ， 大 大 方便 了 现场 使 用 ， 增强 了 系统 的 柔性 。 而 现 有 的 大 范围 
CCD 三 维 视觉 测量 系统 一 般 由 多 个 甚至 多 种 视觉 传 感 顺 组 成 。 由 于 各 传感器 相互 位 置 标定 
的 工作 量 很 大 ， 改 变 传 感 器 间 的 相互 位 置 需要 花费 很 长 的 时 间 ， 且 和 柔性 较 差 。 

(5) 测量 不 受 被 测 物体 表面 差异 的 影响 

由 于 在 图 像 处 理 中 关注 的 是 摄像 机 摄取 的 光 笔 上 点 光源 的 图 像 而 不 是 被 测 物 的 特征 点 ， 因 
此 大 大 降低 了 视觉 测量 系统 中 图 像 处 理 与 分 析 的 难度 ， 提 高 了 测量 的 精确 性 和 稳定 性 。 测 量 基 
本 不 受 被 测 物体 表面 的 几何 形状 、 表 面 曲 率 和 材质 及 环境 变化 的 影响 ， 解 决 了 视觉 测量 中 最 为 
棘手 的 问题 。 有 些 难以 检测 的 位 置 或 育 点 ， 可 以 通过 改变 光 笔 的 长 度 和 形状 来 进行 测量 。 
光 笔 是 一 个 棒状 或 框架 结构 的 部 件 ， 笔 尖 处 装 有 球形 的 触发 测 头 。 测 量 时 光 笔 笔尖 上 的 
触发 测 头 接触 物体 上 的 待 测 点 。 由 以 上 令 述 可 知 ， 单 台 摄 像 机 通过 光 笔 测量 点 坐标 只 能 是 逐 
点 进行 测量 。 测 量 时 ， 摄 像 机 固定 不 动 ， 用 手 拿 住 光 笔 将 测 头 接触 待 测 点 曝光 并 拍摄 ， 计 算 
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得 到 待 测 点 坐标 ， 然 后 测量 另 一 点 ， 如 此 反复 进行 ， 最 后 得 到 的 是 在 统一 的 摄像 机 坐标 系 中 
te Se et ei 
像 平面 的 平面 度 测量 精度 则 更 高 ， 这 是 由 于 测量 棒 形状 的 实际 限制 所 致 。 

6. 5.1 系统 构成 

光 笔 式 三 坐标 测量 机 主要 由 光 笔 、 摄 像 机 、 系 统 软 件 、 计 算 机 及 图 像 采 集 系统 组 成 。 光 
笔 上 至 少 安 装 有 三 个 以 上 的 点 光源 ( 人工 标志 或 发 光 二 极 管 ) 和 一 个 带 球形 笔尖 的 触发 测 
头 。 光 笔 式 三 坐标 测量 机 要 在 光 笔 上 建立 光 笔 坐 标 系 。 根 据 光 笔 式 三 坐标 测量 的 原理 ， 光 笔 
坐标 系 的 坐标 原点 一 般 选 在 触发 测 头 。 这 样 点 光源 和 球形 测 头 在 光 笔 坐标 系 中 的 坐标 是 已 知 
的 。 
6. 5. 2 测量 原理 

光 笔 式 三 坐标 测量 方法 在 近景 摄影 测量 中 也 称 辅助 测量 棒 法 。 借 助 一 根 带 有 三 个 以 上 已 
知 标 志 点 的 辅助 测量 棱 一 一 光 笔 ( 见 图 6. 13a) ， 用 单 台 摄 像 机 即 可 以 进行 空间 点 三 维 测量 。 























Pi Pp Pp 
Pe 4 Py 
六 
Pp 
a) 辅助 测量 棒 b) 点 坐标 测量 


图 6. 13 ”辅助 测量 棒 三 坐标 测量 

光 笔 上 标志 点 (Pi ,P,,P;,…,P,) 和 测 头 〈(P) 在 光 笔 坐标 系 坐 标 系 中 的 坐标 可 预先 标定 
好 ， 即 坐标 是 已 知 的 。 将 光 笔 坐标 系 当 做 辅助 控制 坐标 系 ， 则 光 笔 上 标志 点 即 为 控制 点 。 如 果 
有 三 个 以 上 光 笔 标志 点 〈 控 制 点 ) ， 就 可 以 计算 出 摄像 机 的 外 参数 ， 内 参数 事先 标定 好 。 

在 测量 过 程 中 ， 手 持 光 笔 用 测 头 接触 待 测 点 〈 见 图 6. 13b) ， 从 而 求 得 光 笔 坐标 系 与 摄 
像 机 坐标 系 的 转换 关系 。 摄 像 机 摄取 光 笔 图 像 ， 图 像 采 集 卡 对 图 像 进 行 采集 ， 由 计算 机 进行 
图 像 特 征 提取 得 到 各 点 光源 中 心 图 像 坐标 。 根 据点 光源 在 光 笔 坐标 系 下 的 坐标 及 对 应 的 图 像 
坐标 ， 求 出 光 笔 坐标 系 到 摄像 机 坐标 系 之 间 的 变换 矩阵 ， 进 而 计算 出 球形 测 头 中 心 在 摄像 机 
坐标 系 下 的 三 维 坐 标 。 

光 笔 、 摄 像 机 和 被 测 物体 三 者 之 间 不 需要 严格 精确 的 安装 定位 ， 可 根据 被 测 物体 特点 灵 
活 调 整 摄像 机 位 置 ， 方 便 了 现场 合用， 增强 了 系统 的 柔性 。 被 测 物 及 摄像 机 固定 后 ， 相 对 位 
置 应 保持 不 变 。 通 过 提取 光 笔 上 点 光源 图 像 中 心 坐标 ， 而 不 是 触 测 点 的 图 像 中 心 坐标 来 计算 
某 点 的 三 维 坐标 ， 所 以 测量 不 受 被 测 物 体 表面 的 几何 形状 、 表 面 曲率 和 材质 的 影响 。 这 是 其 
他 光学 测量 法 无 法 解决 的 问题 。 且 对 于 摄像 机 的 观测 盲区 ， 可 通过 改变 光 笔 笔杆 的 长 度 或 形 
状 来 进行 测量 。 

光 笔 测量 方法 在 平行 于 像 平面 的 平面 内 长 度 测量 精度 要 高 于 沿 摄影 方向 的 精度 ， 且 对 平 
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行 于 像 平 面 的 平面 度 测 量 精度 最 高 ， 这 是 由 于 测量 棒 形 状 的 实际 限制 所 致 。 与 传统 的 三 坐标 
测量 机 相 比 ， 这 种 测量 方式 操作 简便 ， 对 操作 者 要 求 低 。 

根据 所 采用 的 摄像 机 台数 的 不 同 ， 光 笔 式 三 坐标 测量 机 一 般 可 分 为 单 摄像 机 模式 和 双 摄 
像 机 模式 甚至 三 摄像 机 模式 。 


6. 5.3 ”数学 模型 


如 图 6. 14 所 示 ， 摄 像 机 采用 针 孔 成 像 模 型 ， 以 摄像 机 光学 透视 中 心 作为 原点 ， 光 轴 方 
向 为 z 轴 ,平行 于 CCD 像素 的 模 纵 方向 分 别 作为 x 轴 和 y 轴 ， 建 立 摄像 机 三 维 坐标 系 0-xyz; 
在 摄像 机 成 像 平面 建立 图 像 平面 坐标 系 o'-x'y'; 以 测 头 点 P 为 原点 建立 光 笔 测 头 空间 坐标 系 
P-XYZ。 图 中 ，4 为 光 笔 上 菏 一 控制 点 ，a 为 控制 点 在 摄像 机 像 平面 内 对 应 像 点 ， 于 是 有 














X, 
Mi 
六 
zy'|=A[R 7] (6. 30) 
1 人 





式 中 ，A 为 摄像 机 内 部 参数 和 矩阵; 丸和 了 分 别 为 光 笔 坐标 系 到 摄像 机 坐标 系 的 旋转 矩阵 和 平 
移 矢量 ; (X,Y ,2Z,)" 为 控制 点 在 光 笔 坐标 系 下 的 坐标 ; (x! ,y')" 为 校正 畸变 后 的 控制 点 图 像 
平面 坐标 。 

当 给 予 足够 多 控制 点 坐标 (X;,Y;,2Z;) 及 其 对 
应 像 点 的 图 像 坐标 (x! ,y')”， 对 于 式 (6.30) 可 
以 求解 出 摄像 机 内 部 参数 矩阵 和 外 部 参数 矩阵 
(R 和 TT)。 这 实际 就 是 摄像 机 的 标定 过 程 。 在 标 
定 的 外 部 参数 中 ,包括 旋 转 矩 阵 R 和 平移 矢量 了 ， 
表示 了 光 笔 坐标 系 和 摄像 机 坐标 系 之 间 的 关系 ， 
即 光 笔 坐标 系 (可 以 看 作 是 世界 坐标 系 ) 在 摄像 
机 坐标 系 中 的 方位 。 那 么 平移 矢量 即 代 表 了 光 笔 
坐标 系 原点 (触发 测 头 ) 在 摄像 机 坐标 系 中 的 坐 
标 ， 因 此 光 笔 触发 测 头 及 其 接触 的 目标 点 在 摄像 
机 坐标 系 中 的 三 维 空间 坐标 可 求 ， 即 达到 了 测量 
三 维 空间 坐标 的 目的 。 在 光 笔 式 三 坐标 测量 机 的 
实际 测量 过 程 中 ， 先 标定 摄像 机 内 部 参数 ， 然 后 光 笔 每 移动 到 某 一 位 置 对 被 测 目 标 进行 测 
量 , 求 出 光 笔 坐标 系 到 摄像 机 坐标 系 的 变换 和 矩阵， 则 可 得 到 光 笔 测 头 在 不 同位 置 时 的 摄像 机 
坐标 系 下 的 三 维 空间 坐标 。 

当 式 (6.30) 中 仅 R 和 7 为 变量 时 ,将 其 转化 为 线性 方程 组 ， 即 
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图 6.14 单 摄像 机 光 笔法 测量 示意 图 
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这 样 方程 有 11 个 未 知 数 ， 有 6 对 以 上 物 像 对 应 点 可 解 出 式 中 a, 的 最 小 二 乘 解 。 在 实际 

应 用 中 ， 由 于 像 面 点 提取 误差 和 控制 点 之 间 位 置 误差 等 ， 线 性 方程 组 解 得 的 矩阵 R 并 不 满 

足 正 交 约束 条 件 。 因 此 ，R 和 7 了 一 般 采 用 非 线 性 方程 进行 求解 。 根 据 式 (6.30) 建立 如 下 
方程 : 


ry re rm LZ, 

















| = (riX;, +rY, +rZ;, + T,) -x!(rX, +reY, +roZ,; +7T.) =0 (6. 32) 
= (rk Fry +r2Z + T) -ynX +rY +rnZ +T) =0 | 

旋转 和 矩阵 R 有 6 个 正 交 约束 条 件 ， 即 

fu =r+r2+-1 

fi =72+r+r-l 

fs3 = +r+r-l (6. 33) 

fs = riry + rors + rare 

fis = Try + rore + raro 

fs = riry + rorg + roro 
通过 构造 惩罚 函数 建立 关于 R 和 TT 的 无 约束 非 线 性 最 优化 目标 函数 ， 有 

Frisry ,rs,T,,T,,T.) = > + 户 ) pe (6. 34) 

式 中 ，W 为 惩罚 因子 。 采 用 LM 优化 算法 即 可 求 出 最 优 R、 Ts 光 笔 采用 不 同 点 阵 模型 的 求 


解 情况 如 下 。 

(1) 空间 点 阵 模 型 

图 6. 15a 所 示 为 6 个 空间 控制 点 的 空间 点 阵 模 型 ， 此 类 触发 测 头 称 之 为 空间 点 阵 模 型 触 
发 测 头 。 将 式 (6. 30) 整理 如 下 : 


(ai 已 + QsY; + a3Z; + aa4 ) 加 (aoX, + Qio¥; + an Zi) x! = Xi 





(6. 35) 
(asX, + aeY; + a7Z; + as ) 一 (aoX, + Qio¥; + anZi)y! 三 yi 
采用 和 矩阵 形式 A 对 =B 表示 ， 其 中 的 系数 矩阵 为 
X Y ZZ 1 0 0 0 0 Xx Yw: Zi%i 
0 0 0 0 XxX YY ZZ 1 和 yi Yy: Ziy 


4' = (6. 36) 


0 0 0 0 Xy Yy Zy 1 Xvyyy 了 yw Znyw 
线性 方程 中 未 知 量 对 = (ao ,a,,…,an) ， 有 11 个 未 知 数 ， 每 一 个 控制 点 的 物 像 坐标 点 
I 请 (6.35) 产生 两 个 线性 方程 ， 那 么 求解 未 知 量 尺 、 了 了 至 少 需 要 6 个 控制 点 ， 才 能 
得 到 线性 方程 组 的 解 。 式 (6.35) 不 是 在 任何 时 候 都 有 惟一 解 ， 这 与 控制 点 在 空间 的 位 置 
对 于 系数 矩阵 4'， 当 矩阵 满 秩 的 时 候 ， 方 程 有 惟一 解 或 者 最 小 二 乘 解 ， 当 其 不 是 满 
秩 时 ， 方 程 组 有 多 个 解 。 考 虑 到 初等 变换 不 改变 4' 的 秩 ，4' 可 写成 如 下 形式 : 
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a0 + 人 +c +d Y ZZ 1 0 0 0 0 Xm Ym Zw 
A'r 0 0 0 0 aX+bY + +d YY ZZ 1 XYy YYy ZY 
0 0 0 0 aXyv+bYv +cZy+t+d Y, Zy 1 XW Yr ON 
(6. 37) 
当 这 些 空间 点 共 面 时 ， 点 坐标 满足 方程 ax + by +cz+d=0， 显 然 矩阵 4 的 第 1、5 列 将 
变 成 全 0 列 ， 其 秩 减 少 2， 小 于 增 广 和 矩阵 的 秩 。 当 未 考虑 和 矩阵 R 的 正 交 约束 条 件 时 ， 只 讨论 
线性 方程 组 的 求解 方程 组 存在 多 个 解 。 








(2) 平面 点 阵 模型 

从 式 (6.35) 分 析 可 知 至 少 6 
个 空间 点 能 产生 惟一 线性 解 R、T 
矩阵， 惟一 确定 触发 测 头 的 空间 位 
置 。 当 空间 点 共 面 时 ， 可 将 式 
(6.31) 简化 ， 假 定 空间 点 z 坐标 





工 


相同 并 设 为 0， 则 式 (6. 31) 简化 
为 a) 空间 点 阵 模型 
Mi mm rr 于 
图 6. 15 
了 入 =4Pm rs TY 
1 六 re 7 1 
(6. 38) 


同样 地 ， 根 据 旋转 矩阵 R 的 正 交 约束 ， 构 造 息 


了 


b) 平面 点 阵 模型 





不 同 触发 测 头 点 阵 模型 


由 





' 
c) 直线 点 阵 模型 








惩罚 函数 ， 建 立 无 约束 最 优化 目标 函数 ， 


采用 优化 算法 获取 最 优 的 R、T。 采 用 线性 解 作为 优化 时 的 初 值 ， 将 式 (6. 38) 表示 为 





EA a! a, a |X. 
T ys 一 Qa Qs Ue Y., 
11 a as 1J4L1 
其 中 
U1 4 03 人 x 
a as ael=4 地 ma rs TD, 
a as 1 ry re 也 
式 (6.39) 等 同 于 
导语 + oY +a3) — (aX, + asY,)x! = x! 
(aX + asY; + a6 ) 一 (a7X, + asY:)y! = yi 
方程 的 系数 矩阵 设 为 4'， 即 
X YY 1 0 0 0 Xx Yx’ 
47 = 0 0 0 XX YY 1 Xy YYy 
0 0 0 Xy Yy 1 Xvyyy 了 yw 


(6. 39) 


(6. 40) 


(6.41) 
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线性 方程 组 有 8 个 未 知 数 ， 每 一 个 控制 点 的 物 像 坐 标点 对 可 以 产生 两 个 线性 方程 ， 则 求解 
R、T 至 少 需要 4 个 非 共 线 控制 点 ， 并 结合 正 交 约束 ， 可 解 得 尺 、7。 类 似 空间 点 阵 模型 ， 初 
等 变换 不 改变 4 的 秩 。4 经 过 初等 变换 后 得 到 








ai +bY +c 并 0 0 0 Xx YYwx 
4 - 。 0 0 aX+bY +e YY 1 X7 YY (6. 42) 
0 0 0 aXy+bYyv+e Ys 1 Xvyy 了 yw 


将 控制 点 置 于 一 个 平面 上 且 至 少 有 两 点 与 其 他 点 不 在 一 条 直线 上 的 称 为 平面 点 阵 模型 触 
发 测 头 ， 如 图 6. 15b 所 示 。 

(3) 共 线 点 阵 模型 

当 平 面 上 这 些 点 共 线 时 ， 点 坐标 满足 方程 ax + by +c =0。 显 然 4' 的 第 1、4 列 将 变 成 全 
0 列 ， 其 秩 至 少 减少 2 而 变 成 6， 小 于 增 广 矩阵 的 秩 ， 方程 存 在 多 解 。 这 也 是 考虑 线性 方程 
组 解 的 情况 ， 由 于 旋转 矩阵 R 存在 约束 ， 下 面 会 进一步 分 析 。 

在 共 线 条 件 下 ， 式 (6.31) 可 以 进一步 简化 ,假设 空间 点 的 y、z 坐标 均 为 0， 则 有 
































% nl 1 

z| ,|_ ,1 x; 

a a wal (6.43) 
1 ry 


式 (6.43) 中 可 解 出 的 未 知 量 共 6 个 ,第 1 列 存 在 正 交 约束 条 件 ， 即 疡 + 六 +=1， 则 解 式 
(6.43) 至 少 需 要 6 个 方程 才 可 以 解 出 。 

由 于 缺少 了 和 矩阵 R 中 的 后 两 列 ， 通 过 解 上 述 方程 无 法 确定 控制 点 空间 坐标 系 与 摄像 机 
坐标 系 的 旋转 矩阵 ， 只 能 确定 控制 点 坐标 系 的 一 根 坐 标 轴 在 摄像 机 坐标 系 中 的 方位 ，R 的 解 
是 不 完全 确定 的 。 但 是 平移 矢量 是 可 以 确定 的 ， 也 就 是 说 光 笔 测 头 坐标 系 的 原点 在 摄像 机 坐 
标 系 中 的 位 置 仍然 能 惟一 确定 。 所 以 以 触发 测 头 为 原点 ， 可 以 实现 通过 控制 点 及 其 对 应 图 像 
点 来 确定 触发 测 头 与 摄像 机 坐标 系 下 的 坐标 。 这 种 将 控制 点 置 于 一 条 直线 上 的 称 为 直线 点 阵 
模型 触发 测 头 ， 如 图 6. 15c 所 示 。 

以 上 由 单 台 摄像 机 与 点 阵 模型 触发 测 头 组 成 的 三 坐标 测量 系统 存在 深度 方向 测量 精度 不 
高 的 问题 。 随 着 噪声 水 平 的 增加 ， 系 统 重复 性 也 变 差 。 为 了 提高 系统 深度 方向 测量 重复 性 精 
度 ， 可 以 采用 高 分 辨 率 CCD 摄像 机 或 者 提高 控制 点 图 像 坐标 的 提取 精度 等 方法 来 实现 。 如 
果 要 获得 更 高 的 精度 ， 采 用 两 台 摄像 机 构成 双 目 视觉 系统 ， 由 双 目 视觉 系统 测量 光 笔 上 控制 
点 的 三 维 坐标 ， 从 而 推算 出 触发 测 头 点 的 三 维 坐标 。 其 测量 原理 就 是 双 目 视觉 测量 原理 ， 所 
不 同 的 是 此 时 双 目 视觉 测量 系统 不 直接 测量 被 测 点 ， 而 是 测量 光 笔 上 控制 点 的 三 维 坐 标 ， 根 
据 已 有 的 位 置 关系 确定 被 测 点 的 三 维 坐标 。 

6. 5.4 ”关键 技术 

光 笔 式 三 坐标 测量 系统 采用 CCD 摄像 机 拍摄 光 笔 图 像 ， 通 过 提取 光 笔 上 光源 控制 点 图 
像 坐标 实现 测量 ， 采 用 的 是 一 种 非 接触 传 感 的 测量 方法 。 因 此 ， 光 笔 是 这 种 测量 系统 中 的 关 
键 部 件 ， 其 物理 参数 、 结 构 参 数 和 材料 及 点 光源 的 成 像 质 量 都 对 测量 系统 的 功能 和 精度 起 着 
重要 作用 。 
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(1) 光 笔 硬件 设计 

光 笔 主要 由 笔 体 、 骨 入 笔 体内 的 点 光源 、 可 装 印 式 笔尖 触发 测 关 和 点 光源 的 电源 组 成 。 

光 笔 作为 测量 系统 的 手持 测量 工具 ， 为 了 保证 测量 精度 并 减 小 测量 系统 受 外 界 环境 变化 
的 影响 ， 需 要 选择 确定 合适 的 光 笔 制作 材料 。 碳 素 纤维 的 膨胀 系数 远 小 于 钢 的 膨胀 系数 ， 而 
且 质 地 比较 坚硬 、 重 量 轻 ， 因 此 是 比较 理想 的 光 笔 材料 。 另 外 ， 还 需 确 定 合 理 的 形状 结构 ， 
要 保证 光 笔 上 控制 点 的 共 线 性 和 共 面 性 及 平行 性 等 特征 。 

摄像 机 通过 拍摄 光 笔 上 点 光源 图 像 完 成 测量 ， 则 点 光源 图 像 质 量 直 接 影响 测量 精度 ， 因 
此 要 求 点 光源 光 强 稳定 、 均 匀 。 发 光 二 极 管 (LED) 具有 体积 小 、 功 耗 低 、 亮 度 高 、 稳 定性 
好 、 使 用 寿命 长 等 优点 ， 因 此 可 根据 摄像 机 CCD 器 件 的 光谱 响应 范围 选择 合适 的 发 光 二 极 
管 作为 光 笔 的 点 光源 。 

(2) 控制 点 图 像 特征 精确 提取 

点 光源 中 心 是 特征 信息 ， 其 图 像 中 心 提取 精度 也 决定 了 测量 精度 ， 因 此 点 光源 图 像 中 心 
的 精确 提取 算法 是 系统 的 关键 技术 之 一 。 作 为 被 测 目 标 控制 点 的 发 光 二 极 管 是 圆 形 的 点 光 
源 ， 但 它 并 不 是 理想 点 ， 而 是 有 一 定 大 小 的 圆 形 光斑 ， 经 过 透视 投影 变换 在 CCD 摄像 机 像 
平面 上 的 像 为 椭圆 形 光 斑 。 由 射影 几何 可 知 ， 圆 孔 中 心 与 其 图 像 的 中 心 并 不 是 准确 的 对 应 
点 ， 存 在 一 定 的 偏差 ， 即 畸变 误差 ， 这 将 对 给 测量 结果 引入 误差 。 采 用 透视 投影 变换 和 空间 
解析 几何 理论 ， 建立 点 光源 在 像 平面 上 的 图 像 中 心 坐 标 模型 ， 再 利用 透视 投影 变换 建立 特征 
点 中 心 的 实际 像 点 坐标 模型 ， 即 可 求 出 畸变 误差 的 数学 模型 ， 从 而 精确 地 提取 点 光源 图 像 坐 
标 。 

(3) 光 笔 轮 廊 自动 跟踪 与 光斑 图 像 自 动 识别 

为 提高 测量 过 程 的 自动 化 程度 ， 对 光 笔 轮廓 自动 跟踪 与 光斑 图 像 自动 识别 是 非常 必要 
的 。 自 动 跟 踪 与 识别 受 环 境 因素 与 噪声 的 影响 ， 因 此 寻求 鲁 棱 性 好 的 自动 跟踪 与 识别 搁 术 是 
光 笔 式 三 坐标 测量 的 关键 技术 之 一 。 


6. 5.5 典型 测量 系统 


光 笔 式 三 坐标 测量 综合 利用 了 视觉 测量 、 图 像 处 理 与 识别 、 目 标 跟踪 等 技术 ， 上 有 具有 测量 范 
围 大 、 柔 性 好 、 便 携 等 特点 。 它 特别 适合 于 工业 现场 应 用 ， 我 国 许多 高 等 院 校 ， 如 天 津 大 学 、 
哈尔滨 工业 大 学 、 北 京 航空 航天 大 学 等 ， 
都 开展 了 光 笔 式 三 坐标 测量 技术 的 研究 。 
国外 典型 的 光 笔 式 三 坐标 测量 系统 包括 
瑞士 Leica 公司 的 T-pro 通用 坐标 测量 机 、 
美国 Accurex 公司 的 ProCam 坐标 测量 机 
和 比利时 Krypton 公司 的 K600 移动 式 坐 
标 测 量 机 等 。 

1. 瑞士 Leica 公司 推出 的 T-pro 通用 
坐标 测量 机 

瑞士 Leica 公司 推出 的 T-pro 通用 坐 
标 测 量 机 ， 主 要 由 激光 跟踪 测 距 仪 、 摄 
像 机 、T-pro 探 尖 和 笔记 本 电脑 组 成 ， 如 
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图 6. 16a 、b 所 示 。 该 系统 的 特点 是 将 激光 跟踪 测 距 和 摄像 机 视觉 测量 技术 相 结 合 ， 提 高 了 
系统 的 测量 精度 和 灵活 性 ,在 17m 的 测量 范围 内 测量 精度 可 达到 0. 06mm。 由 于 T-pro 探头 
上 的 控制 点 采用 红外 发 光 二 极 管 旦 使 用 电池 供电 ， 使 得 探头 可 具有 6 自由 度 ， 测量 范围 可 达 
到 30m。 激 光 跟 踪 仪 配备 了 高 精度 的 水 平和 垂直 角度 编码 器 用 于 测量 角度 和 干涉 仪 ， 从 而 高 
精度 地 测量 出 T-pro 探 尖 上 的 猫眼 到 激光 跟踪 仪 的 距离 。 测 量 时 先 使 跟踪 仪 找到 T-pro 探头 
上 的 猫眼 并 确定 T-pro 探头 的 大 致 位 置 ， 然 后 摄像 机 根据 这 一 位 置 很 快 找到 T-pro 探头 并 对 
其 上 的 10 个 红外 发 光 二 极 管 进行 摄像 ， 最 终 确定 T-pro 探头 尖端 (Probe Tips) 的 坐标 。 

2. 美国 Accurex 公司 的 ProCam 坐标 测量 机 

美国 Accurex 公司 的 ProCam 便携 式 坐 标 测量 机 系统 ， 利 用 “ 反 向 ”摄像 测量 技术 ， 如 
图 6. 17a 所 示 。 系 统 主 要 由 探头 〈 见 图 6. 17c) 和 装 于 探头 上 的 特制 高 分 辩 率 超 轻 摄 像 机 
( 见 图 6. 17b) 、 目 标 靶 盘 〈 可 以 是 移动 的 或 固定 于 天 花 板 或 墙 上 C ， 如 图 6. 17d 所 示 ) 和 计算 
机 组 成 。 目 标 园 盘 上 的 目标 控制 点 是 事先 经 过 精密 测量 的 。 测 量 时 ， 将 探头 尖 接 触 被 测 点 ， 
并 使 探头 内 的 摄像 机 镜头 面向 移动 或 固定 靶 标 盘 ， 按 下 “开始 ”按钮 开始 测量 ， 摄 像 机 拍 
摄 靶 标 盘 上 的 控制 点 的 像 ， 计 算 机 通过 图 像 分 析 和 计算 确定 探头 的 位 置 (相对 于 靶 标 盘 ) ， 



































进而 确定 被 测 点 的 坐标 。 系 统 的 测量 精度 在 距离 靶 标 盘 Im 之 内 的 范围 内 高 于 0.1mm，2m 


以 内 为 0. 2mm。 
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a) b) 0 d) 
图 6. 17 ProCam 测量 系统 
3. 比利时 Krypton 公司 的 k600 移动 式 坐 标 测量 机 
比利时 Krypton 公司 的 k600 移动 式 坐 标 测 量 机 ， 主 要 由 摄像 机 、 笔 记 本 电脑 和 探头 
(Space Probe) 组 成 ， 如 图 6. 18 所 示 。 在 17m 空间 内 ， 其 测量 精度 为 0. 06mm。 








b) 


图 6.18 k600 移动 式 坐 标 测量 机 
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以 上 几 种 探头 式 便携 坐标 测量 机 中 ， 瑞 士 Leica 公司 的 T-pro 通用 坐标 测量 机 和 比利时 
Krypton 公司 的 k600 移动 式 坐 标 测 量 机 最 具有 代表 性 。 它 们 的 特点 是 ， 重 量 轻 ; 以 探头 上 的 
被 测控 制 点 为 摄像 目标 ， 由 于 测量 时 使 用 探头 尖端 来 接触 被 测 点 ， 摄 像 机 拍摄 的 是 探头 
(Probe) 上 控制 点 的 而 不 是 被 测 表面 的 图 像 ， 所 以 测量 精度 不 受 被 测 表 面 质量 (如 曲率 、 硬 
度 等 ) 的 影响 ， 实 现 了 接触 和 非 接触 测量 的 结合 ; 通过 选择 不 同 尺 寸 和 形状 的 探头 尖端 
(Probe Tips) 可 以 测量 小 孔 、 隐 藏 点 和 抛 角 等 。 

4. 工业 近景 摄影 测量 系统 

高 端 数字 摄像 机 及 其 软件 的 快速 发 展 引 起 了 工业 近景 摄像 测量 技术 的 一 场 革 命 。 手 持 式 
数字 摄像 机 由 于 其 便携 性 ， 非 常 适合 在 狭小 空间 和 非常 拥挤 的 场合 进行 测量 。 美 国 Accurex 
公司 的 DPA-Pro 照相 测量 系统 是 一 种 工业 近景 摄影 测量 系统 ， 主 要 由 一 架 高 分 辩 率 的 带 内 光 
灯 的 数字 照相 机 、 笔 记 本 电脑 和 测量 分 析 软 件 组 成 ， 校 准 后 的 比例 棒 和 安装 在 被 测 目标 上 的 
磁性 或 背面 带 黏 性 的 光 反 射 单 元 组 成 ， 如 图 6. 19 所 示 。 测 量 前 先 把 适当 数量 的 光 反 射 单元 
合理 地 安装 在 被 测 目标 上 ， 测 量 时 打开 摄像 机 上 的 闪光灯 对 被 测 目标 上 的 光 反 射 单元 进行 摄 
像 ， 然 后 由 测量 软件 对 图 像 进行 分 析 和 处 理 ， 得 出 测量 结果 。 可 根据 测量 实际 情况 设计 不 同 
的 光 反 射 单元 。 


























6.19 美国 Accurex 公司 的 DPA-Pro 照相 测量 系统 





6.6 几何 光学 法 


摄像 机 光学 镜头 是 由 透镜 组 成 的 。 已 知 焦距 和 像 距 即 可 求 得 物 距 。 因 此 几何 光学 法 测量 
可 分 为 聚焦 法 和 散 焦 法 。 在 传统 的 基于 计算 机 视觉 的 深度 信息 恢复 算法 中 ， 参 数 的 计算 大 都 
是 基于 对 焦 图 像 进行 的 ， 采 用 方法 多 以 立体 视觉 和 运动 视觉 为 主 。 但 如 果 物 体 距 离 摄像 机 太 
近 ， 就 会 因为 立体 影像 中 物体 间 的 视差 过 大 ， 而 导致 立体 对 应 点 匹配 计算 结果 容易 出 错 的 问 
题 。 此 外 对 焦 图 像 虽然 测量 精度 高 ， 但 也 存在 测量 过 程 复 困 和 计算 量 大 等 缺点 ， 因 此 实时 性 
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不 好 ， 很 难 满足 一 般 运 动物 体 的 测量 要 求 。 而 基于 聚焦 测 距 和 散 焦 测 距 的 几何 光学 法 ， 可 以 
克服 上 述 对 焦 图 像 测量 方法 的 缺点 。 

聚焦 法 是 指 在 焦距 是 可 调 的 情况 下 ， 使 被 测 点 处 于 聚焦 位 置 ， 然 后 根据 透镜 成 像 公 式 求 
得 被 测 点 相对 于 摄像 机 的 距离 ， 以 达到 测量 的 目的 。 它 要 求 焦距 可 连续 变化 ， 因 此 硬件 复杂 
且 昂 贵 、 处 理 速度 慢 。 另 外 ， 摄 像 机 偏离 聚焦 位 置 会 于 来 测量 误差 ， 寻 求 精 确 的 聚焦 位 置 是 
关键 所 在 。 散 焦 法 不 要 求 摄像 机 相对 于 被 测 点 处 于 聚焦 位 置 ， 而 是 根据 标定 出 的 离 焦 模 型 计 
算 被 测 点 相对 于 摄像 机 的 距离 。 避 免 了 寻求 精确 聚焦 位 置 而 降低 测量 效率 的 问题 ， 但 离 焦 模 
型 如 何 准确 标定 是 该 方法 的 主要 难点 。 

散 焦 测 距 技术 最 早 是 由 Pentland 在 1987 年 提出 的 ， 如 果 物 体 所 处 位 置 偏离 摄像 机 聚焦 
平面 就 会 在 图 像 传 感 带 上 形成 模糊 的 散 焦 图 像 ， 且 偏离 距离 越 大 ， 图 像 的 散 焦 模糊 程度 也 越 
强 。 利 用 这 一 图 像 变 化 的 特点 ， 物 体 的 深度 信息 可 以 通过 两 幅 以 上 散 焦 程度 不 同 的 图 像 来 获 
得 。 其 基本 原理 是 利用 在 不 同 光 学 参数 下 得 到 的 两 幅 或 三 幅 图 像 来 确定 散 焦 点 扩散 函数 的 扩 
散 参 数 ， 根 据 散 焦 扩 散 参 数 与 物体 距离 的 关系 来 计算 深度 ， 这 种 方法 称 为 散 焦 测 距 。 由 于 散 
焦 测 距 模型 在 近 距 离 时 优异 的 表现 ， 并 且 计 算 方 法 简单 ， 只 需 处 理 单 目 视觉 图 像 即 可 ， 可 以 
避 开 立体 视觉 对 应 点 匹配 的 问题 ， 所 以 散 焦 测 距 一 直 是 计算 机 视觉 研究 领域 中 广 受 关注 的 视 
觉 模型 。 

1987 年 ，Pentland 首先 提出 利用 图 像 模糊 程度 来 计算 物体 的 距离 。 计 算 中 ,使 用 具有 阶 
跃 边缘 的 物体 ， 假 设 系统 的 点 扩散 函数 具有 高 斯 分 布 ， 用 拉 普 拉 斯 算 子 测量 阶 跃 边缘 图 像 的 
模糊 宽度 ， 利 用 散 焦 扩散 参数 计算 出 与 物体 的 距离 。 

1988 年 ，Subbarao 和 Gurumoorthy 发 现 可 以 用 线 扩 散 函 数 的 扩散 参数 表示 物体 的 距离 ， 
计算 物体 阶 跃 边缘 的 深度 。 在 计算 过 程 中 ， 取 消 了 点 扩散 函数 的 高 斯 函数 限制 ， 只 要 求 点 扩 
散 函 数 具 有 圆 对 称 性 ， 使 上 述 方法 可 应 用 于 更 广泛 的 光学 系统 。 

Pentland 提出 使 用 不 同 光学 参数 的 两 幅 图 像 恢复 物体 的 深度 信息 ， 要 求 拍摄 其 中 一 幅 物 
体 图 像 的 孔径 光 亲 是 针 孔 ， 以 致 物体 图 像 在 整个 范围 内 是 清晰 的 ， 而 男 一 幅 图 像 则 采用 大 筷 
径 哲 摄 ， 分 别 将 这 两 幅 物 体 的 图 像 分 成 很 多 对 应 的 子 图 ， 计 算 对 应 子 图 在 一 个 频带 或 多 个 频 
带 中 的 信号 能 量 ， 通 过 对 应 位 置 的 信和 号 能 量 查找 出 物体 的 距离 。 但 这 种 方法 的 最 大 缺点 是 测 
量 时 采用 了 针 孔 ， 导 致 进入 摄像 机 系统 的 能 量 很 少 ， 使 拍摄 图 像 产生 很 大 的 噪声 ， 影 响 测量 
精度 。 同 年 ，Subbarao 研究 了 Pentland 的 方法 ， 取 消 了 拍摄 过 程 的 针 孔 限制 ， 通 过 假设 系统 
的 点 扩散 函数 为 高 斯 分 布 ， 找 出 了 系统 光学 参数 无 限 小 变化 和 有 限 变 化 时 ， 散 焦 扩 散 参 数 与 
光学 参数 变化 的 关系 。 随 后 其 将 该 方法 扩展 到 非 高 斯 分 布 的 散 焦点 扩散 函数 。 

20 世纪 90 年 代 早 期 ， 为 了 提高 散 焦 测 距 方法 的 精度 ，Ens 和 Lawrence 提出 散 焦 测 距 的 
迭代 矩阵 方法 : 寻找 不 同 光学 参数 的 两 幅 散 焦 图 像 的 卷 积 变换 和 矩阵， 认为 卷 积 变换 矩阵 代表 
了 两 幅 散 焦 图像 之 间 的 “点 扩散 函数 ”， 通 过 计算 这 个 “点 扩散 函数 ”的 扩散 参数 ， 估 计 出 
物体 的 深度 分 布 。 

1992 年 ， 有 研究 人 员 认 为 点 扩散 函数 的 扩散 参数 为 两 幅 图 像 的 一 维 传 里 叶 变换 参数 之 
比 ; 在 频 域 中 利用 两 幅 散 焦 图 像 的 频谱 计算 物体 的 深度 ， 其 空间 分 辨 率 为 128 x 128 像素 ， 
深度 测量 的 方 均 误差 为 3.5% 。 为 了 在 频率 域内 精确 估计 出 物体 的 深度 分 布 ，1994 年 有 研究 
人 员 提 出 采用 矢量 滤波 来 补偿 散 焦 传 递 函 数 随 频 率 变化 而 产生 的 非 均 匀 性 。 在 频率 域内 ， 采 
用 在 两 幅 图 像 中 占 支配 地 位 的 频率 来 计算 物体 的 深度 。 
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1995 年 ，Klarquist 提出 了 利用 多 张 散 焦 图 像 作 为 散 焦 测 距 的 最 大 似 然 估计 的 方法 。 这 种 
方法 与 以 往 所 有 的 散 焦 测量 法 都 不 同 ， 是 一 个 全 新 的 散 焦 测量 法 。 但 这 种 方法 需要 求 出 最 佳 
成 像 点 位 置 ， 且 未 知 量 数 目 增多 而 使 估 测 值 易 受 噪 声 影 响 。 

1995 年 ，Rajagopalan 和 Chaudhuri 将 图 像 分 成 若干 个 子 图 像 ， 其 中 各 相 邻 字 图 像 互 有 重 
丢 ， 再 以 位 移 变动 的 区 域 作 计算 ， 解 决 了 因为 点 扩散 函数 在 图 像 临 近 区 域 间 造 成 重 和 到 的 问 
题 。 1 

1999 年 ， 有 研究 人 员 提 出 了 使 用 灵敏 度 分 析 探 讨 使 用 圆柱 状 的 PFS 来 估计 误差 与 不 同 
频率 成 分 的 关系 ， 并 提出 了 使 基于 散 焦 图 像 的 测 距 方法 的 估计 更 为 精确 的 研究 方向 。 但 是 相 
应 的 分 析 都 只 是 针对 如 何 调整 相对 模糊 的 参数 来 让 估计 误差 降 到 最 低 ， 并 没有 提 到 绝对 参数 
如 何 影响 DFD 的 精度 。 

散 焦 测 距 研 究 大 至 上 可 分 为 两 方面 : 一 是 摄像 机 参数 标定 工作 ， 二 是 深度 重建 的 方法 。 
散 焦 测 距 的 经 典 算法 有 Pentland 算法 与 Subbarao 算法 。 


6. 6. 1 散 焦 测 距 的 基本 原理 


如 图 6. 21 所 示 ， 根 据 几何 光学 的 透镜 成 像 公 式 ， 即 
到 二 二 (6.44) 
式 中 ,vw 为 像 距 ; zw 为 物 距 ;为 透镜 的 焦距 。 假如 p, 的 位 置 上 有 一 点 光源 ， 则 由 式 
(6.44) 可 知 其 必 成 像 于 CCD 像 面 上 一 点 。 若 将 点 光源 由 mm 移 至 p,， 则 由 式 (6. 44) 可 知 
p 将 无 法 在 CCD 面 上 成 像 ， 而 将 是 成 像 在 CCD 的 前 面 ， 其 结果 便 是 在 CCD 像 平 面 上 形成 
半径 大 小 为 1 d1 的 模糊 圆 。 
根据 图 6. 20 所 示 的 几何 关系 可 镜头 




















9 三 | 
村 





tang0 = (6.45) 
v 


式 中 ， 有 为 透镜 半径 。 此 外 ， 图 6. 20 引 | 
所 示 的 p, 点 也 需要 满足 透镜 的 成 像 卫 


公式 














1 1 1 
结合 式 (6.44)、 式 (6.45) 和 式 
(6.46) 可 得 





图 6. 20 ”透镜 成 像 模型 





FRv, 
"TT Rv -F(R+d) 
可 见 ， 车 uw 则 式 (6.47) 中 的 a 为 正 值 ; 反之 , 若 v<z 则 4 为 负 值 。 定义 镜头 的 
光圈 指数 (f-number) : 





(6.47) 


/= 记 (6. 48) 
对 于 具体 透镜 来 讨 ， 光 圈 指 数 了 是 一 个 固定 常数 。 将 式 (6.48) 代入 式 (6. 32) ， 可 得 
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Fv 
wm-F-2d 
Fvo 
ww -FF+2d 
因此 若 能 测量 出 模糊 圆 的 半径 4， 则 该 圆 所 对 应 点 的 景深 信息 便 可 由 式 (6.49) 求 得 。 
实验 发 现 ， 模 糊 光斑 的 半径 4 与 光源 的 分 布 函数 有 关 。 在 实际 环境 下 ， 因 光线 的 路 径 长 
短 不 一 ， 所 以 模糊 圆 的 亮度 呈现 中 间 最 亮 ， 而 向 外 逐渐 变 暗 。 因 此 ， 可 以 用 二 维 高 斯 分 布 函 
数 h(r,6) 来 描述 模糊 圆 的 亮度 变化 情况 。 


u (u = uo) 


(6.49) 


u (u < uo) 











h(r,o) = 7 7 =x +y (6. 50) 
其 傅 里 叶 变 换 为 
H(w,vr) = e-” 人 (6,51) 


式 中 ，o 为 模糊 圆 的 模糊 参数 ;， w，z 为 空间 频率 。 若 o 越 大 则 表示 该 圆 的 模糊 程度 越 高 ， 
其 模糊 圆 半径 也 越 大 。 因 此 ， 在 实际 应 用 中 一 般 假设 模糊 圆 半 径 d 与 此 高 斯 分 布 函 数 的 模糊 
参数 e 成 正比 ， 两 者 的 比例 关系 一 般 表 示 为 
oo=kd 或 4d =ho (人 >0) (6. 52) 
式 中 ,上 为 透 光 率 ， 是 与 透镜 相关 的 常量 。 
若 将 图 像 的 成 像 过 程 视 为 线性 非 时 变 过 程 ， 则 模糊 图 像 Kx,y) 的 每 一 个 像素 ， 可 视 为 
一 幅 清 晰 图 像 (x,y) 与 高 斯 分 布 函 数 h(r,o) 作 卷 积 的 结果 ， 即 
T(x,y) = (x,y) *h(r,o) (6.53) 
将 式 (6.51) 代入 式 (6.47) ， 则 有 
u = 上 (6. 54) 
2 
因此 ， 若 能 求 出 模糊 参数 o 的 大 小 ， 将 其 代入 式 (6. 54) 即 可 得 到 景深 信息 。 可 见 散 
焦 测 距 的 关键 问题 就 转换 成 模糊 参数 o 的 计算 。 


6. 6. 2 ” 散 焦 测 距 的 Pentland 算法 


Pentlnad 提出 两 种 方法 实现 物体 深度 图 像 的 重建 : 第 一 种 方法 基于 测量 散 焦 图 像 的 模糊 
边缘 ， 这 种 方法 需要 知道 图 像 边缘 的 位 置 和 幅 值 大 小 ; 第 二 种 方法 是 通过 比较 两 幅 通过 不 同 
摄像 机 光圈 所 拍摄 的 图 像 ， 计 算 对 应 
区 域内 的 散 焦 程度 变化 ， 得 到 深度 信 
息 


心 \o 








1. 单 幅 阶 跃 边缘 灰 度 图 像 测 距 方 
法 

Pentlnad 提出 的 第 一 种 散 焦 测 距 
方法 是 单 幅 阶 跃 边缘 灰 度 图 像 测 距 方 
法 。 其 基本 原理 是 ， 如 果 知 道 单 幅 阶 
跃 灰 度 图 像 I(x,y) 的 灰 度 阶 跃 边 缘 图 6.21 具有 阶 跃 灰 度 变化 的 图 像 (x,y) 
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位 置 与 幅 值 大 小 ， 则 可 以 通过 将 原始 图 像 1(x,y) 与 高 斯 分 布 隐 数 h(r,o) 做 拉 普 拉 斯 卷 积 3 
求解 模糊 参数 。 
如 图 6. 21 所 示 ， 假 设 图 像 I(x,y) 在 位 置 (x,。，y。) 处 有 一 个 阶 跃 的 灰 度 变化 ， 变 化 值 
为 o。 则 图 像 (x,y) 的 亮度 定义 为 
I(%,y) = | 
令 C(x,y) 是 图 像 1(x,y) 与 高 斯 点 扩散 函数 h(r,6) 的 拉 普 拉 斯 算 子 的 卷 积 ， 即 
C(x,y) = V (G(r,0) * I(x,y)) 
= vic (x ut (x 0 0) * Tu,v) dudo 





























m+éE€ YX 之 %0 (6 55) 


m X < %0 









































_ 2 (6. 56) 
令 xu =0， 则 
_ dG(x,0) -ex Ss x 
C(x,y) = 2 下 = ee p( 二 7) (6.57) 
式 (6.57) 两 边 取 绝对 值 ， 再 取 自 然 对 数 可 得 
2 生 (6. 58) 
x /io 20 
记 4= -2 B= 加， C= 四。 则 式 (6.58) 可 以 表示 为 
4xz +B=C (6. 59) 
把 式 (6. 59) 看 成 是 x 的 线性 回归 方程 ， 这 样 可 得 到 常量 4 和 B 的 最 大 似 然 佑 计 为 
二) 人 四 
4 (6. 60) 
2 
式 中 , x 为 wx 的 平均 值 ;C 为 C, 的 平均 值 。 由 式 (6. 58) 可 得 
og = (-24)3 (6.61) 


求 得 o 的 值 ， 就 可 以 利用 式 (6. 54) 来 确定 物体 的 距离 u。 

2. 两 幅 不 同 散 焦 程 度 图 像 测 距 的 原理 及 实现 

单 幅 阶 跃 边缘 灰 度 图 像 测 距 方 法 需要 预先 知道 图 像 边缘 的 位 置 和 幅 值 大 小 ， 这 就 限制 了 
它 的 应 用 范围 。 因 此 ，Pentland 又 提出 了 基于 两 幅 场景 相同 仪 是 散 焦 程度 不 同 的 图 像 进 行 测 
距 的 方法 : 首先 ， 将 摄像 机 的 镜头 光圈 调 到 最 小 ， 利 用 小 孔 成 像 原理 取得 第 一 张 清晰 的 图 
像 ; 接着 ， 将 摄像 机 镜头 的 光圈 放大 ， 取 得 另外 一 张 不 同 模糊 程度 的 图 像 ， 并 将 其 看 成 是 清 
晰 图 像 透 过 点 扩散 函数 作用 的 结果 ; 然后 ， 用 逆 滤 波 的 方法 来 估计 出 物体 的 距离 。 

取 图 6. 22a 所 示 图 像 厂 (x,y) 中 的 一 个 区 域 几 (rr;,9) ,fi(7,0) 以 (x，m) 为 中 心 ， 则 有 

fi(r,0) = LT (xo +rcosg,yo + rsing) (6. 62) 

计算 其 二 维 傅 里 时 变换 (1,0) 。 在 图 6. 22b 所 示 的 五 (x,y) 中 取 对 应 的 区 域 f(r,0) ， 也 
人 ei 这 两 个 区 域 覆 六 图 像 的 同一 位 置 。 因 此 ， 奉 不 存在 模糊 ， 
则 它们 应 该 等 于 同一 函数 方 (r,9) 。 因 此 ， 有 
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a) 图 像 71(x,y) b) 图 像 1,(x,y) 


图 6.22 两 幅 散 焦 程度 不 同 的 图 像 

fi(r,0) _h(r7,0) * G(r,0) 

f(r,0) f(r,0) * G(r,o,) 

因为 f(r,6) = e-” 和 F(A,0) = e-™ 是 一 对 人 很 里 叶 变 换 对 ， 因 此 根据 传 里 叶 变 换 的 性 
质 有 





(6. 63) 














__ lr/A 
A(7,0) = 27F (2,0) (6. 64) 
因此 有 
a F(a,0) ca, L 】 
amp (6. 65) 
a Fl,0) G7, es 】 
对 比 两 式 ， 则 有 
1 
C| 和 ， 
Pro) = | | = exp(A’27(02 - 07)) (6. 66) 
| 
本 
式 中 , P(A) = F(X,0)40 。 方 程 两 边 取 自 然 对 数 ， 则 
A22m(ol -ol) = InF(A) - lnF,(A) (6. 67) 
把 式 〈6. 67) 改写 为 
AA* =B (6. 68) 


式 中 ,4 = 27(02 -01);B = lInF,(A) -lnF,(A) 。 即 把 4A =B 看 成 是 关于 A 的 线性 回归 
方程 ， 这 样 就 可 以 得 到 关于 4 和 B 的 估计 值 。 因 为 假设 摄像 机 是 针 孔 的 ， 所 以 有 

A = A’2m0o2 (6. 69 ) 
因此 可 得 


0; = /二 (6.70) 
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将 式 (6.69) 带 入 式 (6. 54) 就 可 以 求 出 物体 的 深度 信息 。 
6. 6. 3 ”Subbarao 的 深度 恢复 算法 


Pentland 提出 的 第 二 种 散 焦 测 距 方法 中 ,一 幅 图 像 是 通过 设置 正常 光圈 获取 的 ， 男 一 幅 
图 片 必须 在 针 孔 模式 下 获取 的 ， 即 将 光圈 调 到 非常 小 时 获取 另 一 幅 图 像 。 这 种 方法 在 实际 应 
用 上 存在 一 些 问 题 ， 例 如 光圈 太 小 容易 形成 衍射 效应 ， 从 而 使 图 形 失真 。 而 且 小 光圈 的 进 光 
量 太 少 ， 要 增加 曝光 时 间 。 这 就 使 Pentland 的 方法 在 应 用 上 受到 限制 。 

1. 通过 调节 摄像 机 镜头 孔径 的 深度 恢复 算法 

针对 Pentland 方法 的 不 足 ，1988 年 Subbarao 放宽 了 Pentland 方法 中 必须 将 其 中 一 张 图 
像 的 摄像 机 镜头 孔径 调 到 最 小 限制 。 通 过 调节 镜头 的 孔径 ,在 相同 的 像 距 下 ， 对 相同 的 景 
取 两 幅 图 像 。 由 于 镜头 孔径 的 不 同 ， ee 


成 像 几 何 模 型 如 图 6. 23 所 示 ， 由 几何 光学 适 镜 成 像 公式 下 | + 二 ， 根据 相似 三 角形 
关系 ， 可 以 得 到 











dm， 1 
| 0 
因此 可 以 得 到 
d = mm =| (6.72) 
将 ， = 大 -二 代入 式 (6.72) 得 
1 1 1 
4 = rm (6.73) 


因此 ， 当 物 距 的 保持 不 变 时 ， 随 着 mw 的 大 小 变化 ，d 可 正 可 负 。 将 式 (6.73) 代入 式 
(6.52) 可 以 得 到 





r= inu( 天 -二 -二 (6.74) 


点 扩散 函 数 定义 为 二 维 高 斯 函数 ACx,y) = 于 -ae 扩散 参数 g=1d,， h(x,y) 的 全 





























(w2+02)02 


里 叶 变 换 为 H(w,v) =e”，”; w、v 是 空间 频率 ; 模糊 参数 o 在 不 同 距离 时 是 不 等 的 。 
由 于 所 处 理 的 是 图 像 子 块 ， 所 以 认为 是 同一 距离 的 ， 因 此 o 近似 为 恒定 的 。 

一 个 图 像 块 的 模糊 参数 o 可 以 通过 一 个 或 多 个 参数 来 改变 ， 保 持 物体 到 摄像 机 镜头 的 
距离 不 变 ， 随 意 改变 其 他 变量 的 数值 获取 两 幅 图 像 。P (w,w) 和 P,(w,v) 为 这 两 幅 图 像 对 应 
的 功率 谱 密度 ， 其 摄像 机 参数 分 别 为 w 、 矿 、D 和 vw、 、D,，o 和 为 其 对 应 的 模糊 参 
数 。 

根据 图 像 功率 谱 密度 的 定义 ， 即 

ee (6.75) 
可 以 得 到 不 同 镜头 孔径 下 的 两 个 图 像 的 功率 谱 密度 表达 式 ， 即 
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(w2+12)0? 
Pl(w,v) =e 2 Ko)E (oz) 
(6., 76) 


2 .2 2 
(w+v )o7 


P(w,v) =e Flw,v)rF (oz) 
式 中 , F(w,v) 为 理想 图 像 1,(w,v) 的 傅 里 叶 变 换 ;F* (w,v) 为 其 傅 里 叶 变换 的 共 恩 。 根 据 式 
(6.76) 可 以 得 到 








(w2+412) (02-02) 
Pi(w,v) 四 











P(w.0) = e (6.77) 
对 式 (6.77) 两 边 取 对 数 并 进行 相应 的 整理 ， 可 以 得 到 
al - oj; = | | Tit) (6.78) 
CO 十 2 P,(w,v) 


对 于 某 一 个 给 定 的 (w, v)， 式 (6.78) 的 右边 可 以 由 给 定 的 图 像 对 计算 出 ， 所 以 可 以 用 式 
(6.78) 来 估计 of -0 的 值 。 理 论 上 ,测量 一 点 (w，2) 的 功率 谱 密 度 就 能 得 到 cy - oz3 的 
一 个 估计 值 。 为 了 获得 更 好 的 鲁 棒 性 ， 在 一 个 频 域 空间 内 取 平 均值 ， 即 
1 | P (wy 
可 o” a 
式 中 , R 是 (w, v) 空间 里 不 包括 G,(w,v) = G6,(w,v) 成 立 的 (w,v) 的 集合 区 域 ; 4 是 RR 的 
面积 ; C 是 o? -0 平均 值 。 因 此 有 








]aou (6. 79) 


ao -ol =C (6. 80 ) 
式 (6.80) 中 有 两 个 未 知 数 ， 可 以 由 实际 的 摄像 机 参数 设置 来 获得 如 下 方程 而 求 得 : 





1 1 1 
1 1 1 
0, = k,D,vo, 人 要 二 】 
02 
消去 (6. 81) 中 的 变量 w， 即 可 得 到 
Cl = a0, +B (6. 82) 
其 中 
kDivo 
0 (6. 83) 
hk, D,vo, 
1 1 1 1 
B= Dm (6. 84) 
Ws . 万 270> 本 


联 立 式 (6. 81) 和 式 〈6.83) ， 消 除 变量 o 可 以 得 到 关于 o, 的 表达 式 ， 即 
(a -1)o? +2aBo, +B = C (6. 85) 
这 是 一 个 关于 co， 的 一 元 二 次 方程 ， 通 常情 况 下 它 有 两 个 解 ， 而 当 wu, = w, 时 有 惟一 解 。 解 出 
0, 后 ,代入 式 (6. 81) 即 可 得 到 物体 的 景深 即 
于 k,D,s,fs 
Po +hD,(f —s,) 
2. 微 幅 政变 摄像 机 参数 获取 景深 
Subbarao 提出 的 第 二 种 方法 是 微 幅 改变 摄像 机 的 参数 ， 假 设 其 中 一 幅 图 像 的 参数 是 un 、 
亡 、r， 则 另 一 幅 图 像 的 参数 是 wo + ds 、A+dA +dr。 对 图 像 功 率 谱 密 度 函 数 进 行 求 导 可 得 

















(6. 86 ) 
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dP =-2(w +v)Podo (6. 87) 
因此 
1 dP 
do = -一 一 一 一 一 一- 6. 88 
oe 2(w +vw) PP ( ) 
令 
1 dP 
(OR 6. 89 
2(w +vw) PP ( ) 


理论 上 只 要 测量 出 一 点 的 P 和 dP 的 值 就 可 以 求 出 C。 为 了 获得 更 好 的 鲁 棒 性 ， 一 般 取 
一 个 区 域 的 平均 值 ， 即 令 





-a zea + [Pee liow (690) 


式 中 ,RR 为 不 包括 dP (w, v) =0 的 频率 区 域 ， 4 是 民 的 面积 。 根 据 式 (6.88) 对 o 求 导 
可 以 得 到 
do = Peds + + adD = ds + f+ dD (6. 91) 
由 式 (6.91) 代入 式 (6. 88) 可 以 得 到 
1 1 -1 1 dP 
"iD 人 -二 儿 = (6.92) 
把 式 (6.74) 带 入 式 (6. 92) 可 以 得 到 
2r211 1 1 1 1 1 1 dP 
Pp (F- -二 儿 -二 jd = -过 6 (6. 93) 


u 了 
为 了 表示 方便 ， 设 

















K = 1 Dds (6. 94) 
1 1 
Y=-2L_1 6. 95 
0 ( ) 
因此 式 (6.93) 可 以 表示 为 
K(x-L)x =C (6. 96) 


对 式 (6. 96) 进行 未 知 参数 的 求解 ， 得 到 
K+ VK +4KCs” 














对 = 2 (6.97) 
因为 在 正常 的 实验 条 件 下 /<u< ow ， 所 以 有 
Pg 4 4KCs’” (6. 98) 
将 式 (6.98) 代入 式 (6.95)， 并 进行 适当 整理 可 以 得 到 物体 的 距离 wx， 即 
Re | (6. 99) 
1 Ki yk FA4KC Si 
f 2Ks 


物体 的 距离 也 可 求 。 


第 7 章 ” 双 日 视觉 测量 


双 目 视觉 系统 直接 模拟 人 类 视觉 结构 ， 采 用 两 台 性 能 相同 、 位 置 相 对 固定 的 图 像 传 感 
带 ， 获 取 同 一 景物 的 两 幅 图 像 ， 通 过 计算 空间 点 在 两 幅 图 像 中 的 “视差 "来 确定 场景 的 深度 
信息 ， 进 而 构建 场景 的 三 维 结构 。 

在 双 目 视觉 测量 中 ， 两 全 摄像 机 接 入 双 输 入 通道 图 像 采 集 卡 或 分 别 接 入 单 通道 图 像 采 集 
卡 ， 把 摄像 机 采集 到 的 模拟 信号 经 过 滤波 、 采 样 、 量 化 、A-D 转换 ， 向 计算 机 提供 数字 图 像 
数据 。 典 型 双 目 视觉 系统 中 ， 两 台 摄 像 机 光 心 沿 基 线 放 置 ， 其 光 轴 平行 或 互 成 一 定 角度 ， 空 
间 点 分 别 在 左右 两 个 摄像 机 像 平面 上 投影 成 像 。 成 像 点 之 间 的 坐标 差异 称 为 视差"?。 双 目 
视觉 测量 系统 通过 极 线 约束 和 图 像 匹 配 寻找 空间 点 在 双 目 视 图 中 的 公共 特征 点 ， 采 用 标定 后 
的 摄像 机 内 外 参数 和 计算 的 视差 ， 通 过 摄像 机 模型 ， 可 获取 空间 点 的 三 维 空间 坐标 。 双 目 视 
觉 测量 的 计算 涉及 图 像 处理 、 特 征 提取 、 图 像 匹 配 、 摄 像 机 标定 及 摄像 机 模型 分 析 等 。 






































7.1 双 目 视觉 测量 系统 


双 目 视觉 测量 是 建立 在 计算 机 视觉 理论 基础 上 的 三 维 测量 方法 。 它 利用 两 台 位 置 相对 园 
定 的 摄像 机 ， 从 不 同 角度 拍摄 获取 同一 场景 的 两 幅 或 多 幅 图 像 。 通 过 计算 空间 点 在 两 幅 ( 多 
幅 ) 图 像 中 对 应 成 像 点 的 像 差 来 获得 空间 的 三 维 坐 标 。 完 整 的 双 目 视觉 系统 可 分 为 六 个 部 
分 : 图 像 获取 、 摄 像 机 标定 、 双 目 视觉 系统 标定 、 特 征 提取 、 双 目 图 像 匹 配 和 三 维 重建 。 图 
像 获 取 需 要 建立 图 像 采 集 系统 和 光源 照明 系统 ， 要 考虑 被 摄 景物 的 特征 及 系统 的 拍摄 视角 等 
因素 。 图 像 采 集 的 目的 是 获得 高 质量 的 图 像 信息 ， 它 对 后 续 的 图 像 处 理 与 分 析 、 特 征 提取 和 图 
像 匹配 等 均 有 较 大 影响 。 如 前 所 述 ， 摄 像 - 
机 标定 是 通过 实验 方法 确定 摄像 机 的 内 外 Ec 
参数 。 双 目 视觉 系统 标定 是 确定 双 目 系统 
的 结构 参数 ， 这 些 标定 是 双 目 视觉 系统 进 
行 三 维 测量 的 前 提 条 件 。 特 征 提取 是 图 像 
匹配 和 视觉 测量 的 必要 步骤 ， 通 过 特征 提 
取 才能 进行 双 目 图 像 检测 特征 匹配 ， 才 能 
对 被 测 物 的 特征 点 进行 测量 。 图 像 匹 配 是 
建立 双 目 视觉 图 像 间 的 对 应 关系 从 而 为 计 
算 视差 创造 条 件 的 过 程 。 双 目 视觉 的 最 后 
阶段 ， 也 就 是 双 目 视觉 空间 三 维 测量 根据 
摄像 机 模型 和 空间 同一 点 在 两 幅 图 像 中 的 
视差 计算 出 在 特定 坐标 系 下 三 维 空间 点 的 
坐标 ， 进 而 实现 三 维 测量 和 三 维 重建 。 
双 目 视觉 测量 系统 结构 如 图 7.1 所 SR ds 






















































































摄像 机 2 图 像 摄 取 













摄像 机 1 图 像 摄 取 





























特征 提取 及 图 像 匹配 


三 维 坐标 测量 
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示 。 首 先 ， 建 立 双 目 视觉 测量 系统 并 对 摄像 机 和 双 目 视觉 系统 进行 标定 ， 获 取 视 觉 三 位 测量 
所 需 的 摄像 机 内 外 参数 和 双 目 视觉 系统 结构 参数 。 视 觉 测量 时 ， 两 台 摄像 机 在 不 同位 置 同 步 
拍摄 同一 场景 ， 获 取 立 体 图 像 对 。 两 幅 图 像 通 过 图 像 采集 卡 输入 计算 机 ， 在 计算 机 中 对 这 两 
幅 图 像 进行 图 像 处 理 与 分 析 ， 提 取 图 像 特征 并 进行 图 像 匹 配 。 根 据 匹 配 的 特征 点 获得 空间 的 
同一 点 在 双 摄 像 机 图 像 上 的 对 应 点 ， 最 后 根据 对 应 点 的 视差 并 通过 摄像 机 模型 计算 出 空间 点 
的 三 维 空间 点 坐标 。 


7.2” 双 目 视觉 三 维 测量 原理 











双 目 视觉 成 像 可 以 获得 同一 场景 的 两 幅 不 同 的 图 像 ， 双 目 成 像 的 系统 模型 可 看 作 是 由 两 
个 单 目 成 像 系统 组 合 而 成 的 。 如 图 7.2 所 示 ， 两 台 摄 像 机 的 镜 关 中心 或 光学 中 心 之 间 的 距离 
称 为 双 目 视觉 系统 的 基线 利用 双 目 视觉 成 像 系统 可 以 确定 具有 像 平 面 坐标 点 (x,，y) 和 
(x,，Y) 的 三 维 空间 点 到 的 世界 坐标 。 





B WX, ¥ D) 

















图 7.2 双 目 成 像 示 意图 图 7.3 平行 双 目 成 像 中 的 视差 


1. 两 台 摄 像 机 相同 且 它 们 的 摄像 机 坐标 系统 各 对 应 轴 精 确 平行 ( 光 轴 平行 ) 

图 7. 3 给 出 了 两 台 摄 像 机 镜头 连 线 所 在 的 平面 (XZ 平面 ) 。 将 世界 坐标 系 设置 在 第 一 台 
摄像 机 的 摄像 机 坐标 系 上 ， 即 世界 坐标 系 和 第 一 台 摄像 机 的 摄像 机 坐标 系 重合 。 根 据 摄像 机 
坐标 系 与 世界 坐标 系 重合 情况 下 的 透视 变换 公式 ， 三 维 空间 点 WW 的 轴 坐 标 可 表示 为 

hh = -2) wh 

式 中 , X 和 为 三 维 空间 点 WW 在 世界 坐标 系 (此 时 世界 坐标 系 与 第 一 个 摄像 机 坐标 系 重 

合 ) 中 的 基 轴 和 ZZ 轴 坐 标 。 同 理 ， 如 果 将 世界 坐标 系 设置 在 第 二 台 摄像 机 上 ， 即 世界 坐标 系 
和 第 二 台 摄 像 机 坐标 系 重合 ， 则 丈 点 的 艺 轴 坐标 可 表示 为 

=U- 人 

因为 基线 长 度 是 B 且 三 维 空间 点 WW 的 Z 轴 坐 标 对 两 台 摄像 机 坐标 系统 是 一 样 的 ， 所 以 





有 
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X, =X +B 有 
2 =Z =Z C0 
将 式 (7.3) 代 入 式 (7.1) 和 式 (7.2) ， 得 
x 0 (7.4) 
X +B = 0-2) (7.5) 
式 (7.5) 减 去 式 (7.4) 可 解 出 Z， 有 
Z=f- 0 =/(1 -了 了) (7.6) 


式 (7.6) 把 三 维 空间 点 与 像 平面 之 间 的 距离 Z， 即 三 维 信 息 中 的 深度 信息 ， 与 视差 D( 三 
维 点 对 应 的 像 坐标 x, 和 >” 之 差 ) 直接 联系 起 来 。 视 差 的 大 小 直接 与 深度 有 关 ， 所 以 视差 包 
含 了 物体 的 三 维 空间 信息 。 通 过 视差 可 以 求 得 三 维 空间 点 到 摄像 机 的 距离 ， 确 定 三 维 空间 点 
在 世界 坐标 系 中 的 坐标 。 

如 果 视 差 D 可 以 确定 并 且 已 知 两 台 摄像 机 之 间 的 基线 距离 和 摄像 机 的 焦距 ,很 容易 计 
算出 三 维 空间 点 下 的 Z 轴 坐 标 。 男 外 ，Z We 点 多 的 世界 坐标 X、 了 轴 坐 标 可 用 
(zx1，Y1) 和 (x,，y,) 借 助 透 视 变换 得 到 ， 晴 














a (7.7) 
X= FY-2) (7.8) 
同 理 
A 
Y, = Z) (7.9) 
= 学 (f-2) (7. 10) 
这 样 ， 通 过 三 维 空间 Re 可 求 空间 一 点 的 三 维 坐标 。 因 此 ， 对 
于 两 台 摄像 机 像 平 面 上 的 任意 一 点 ， 只 要 能 够 在 男 一 台 摄像 机 像 平 面 上 找到 对 应 的 匹配 点 


( 即 两 者 是 空间 人 ， 就 可 以 通过 视差 确定 出 该 点 的 三 维 空 
间 坐 标 。 这 种 方法 是 点 对 点 的 运算 ， 两 台 摄像 机 像 平 面 上 所 有 点 只 要 存在 相应 的 匹配 点 ， 就 
可 与 参与 上 述 运 算 ， 从 而 获取 其 对 应 的 三 维 空间 坐标 。 
2. 摄像 机 光 轴 汇聚 的 情况 
考虑 图 7. 2 所 示 的 情况 ， 它 是 将 两 个 单 日 系统 绕 各 自 中 心 相 向 旋转 得 到 的 。 图 7.4 给 出 
两 个 镜头 连 线 所 在 的 平面 (XZ 平面)。 两 镜头 中 心间 的 距离 (基线 )。 两 光 轴 在 XZ 平面 相 
交 于 (0, 0, 2Z) 点 ， 交 角 为 20( 未 知 ) 。 如 果 已 知 像 平面 坐标 点 为 (x; ，y) 和 (x,，y,)， 如 何 
求 取 世 界 点 下 的 坐标 (X，Y，2Z)。 
首先 ， 由 地 界 坐标 轴 和 摄像 机 坐标 轴 围 成 的 三 角形 可 知 
_BcosO0 
2sin0 
从 点 下 分 别 向 两 台 摄像 机 坐标 轴 作 垂 线 ， 因 为 这 两 个 垂 线 与 X 轴 的 夹 角 都 是 9， 所 以 根据 相 

















(7.11) 
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似 三 角形 的 知识 可 知 WX, ,DD 
XL AXcos0b 图 像 1 
f r-Xsing (7.12) es 入 
X2 _ AXcos0 
f r+Xsing 
式 中 , r+ 为 从 镜头 中 心 到 两 系统 会 聚 中 心 点 的 距 “ 000 
离 ( 未 知 ) ， 且 有 
2 了 1 I 
。 2sin0 3 We [2 
根据 式 (7. 12) ， 联 立 消去 r 和 针 ， 可 得 
xir= (fcos0 +xising)X (7.14) 
xsr = (fcos0 +x,sing)X (7.15) 图 7.4 汇聚 双 目 成 像 中 的 视差 





式 (7. 14) 与 式 (7. 15 ) 相 除 ， 可 得 


cosO 


X1 jcosg +xising 了 











x, os0 -xsin0 二 











sing “” 
所 以 
wa caso 一 %1X2 -af cosg 十 XiX2 
CosO _ 2x1%, 
sin0 (x -x,)f 
将 式 (7. 17) 代 入 式 (7. 11) 可 得 
Xxx B Bb 
二 二 一 WN 一 
(x1 —%2)f "°°Df 





式 (7. 18) 将 物体 与 像 平 面 的 距离 Z 与 视差 D 直接 联系 起 来 ， 不 但 要 知道 





知道 x, 、x, 本 身 。 


7.3” 双 目 视觉 测量 数学 模型 








在 计算 机 视觉 中 采用 双 目 视觉 方法 进行 三 维 空间 测量 
维 图 像 测量 物体 上 某 些 特征 点 的 三 维 空间 
坐标 并 恢复 物体 三 维 几 何 形状 的 方法 。 三 
维 测量 和 重建 是 紧 随 摄像 机 标定 之 后 关键 
的 一 步 ， 可 对 现场 中 的 点 、 线 或 曲线 构成 
的 轨迹 或 物体 轮廓 进行 定位 和 形状 恢复 。 

如 图 7.5 所 示 ， 对 于 空间 物体 表面 任 
意 一 点 P， 如 果 用 摄像 机 C, 观察 ， 它 在 
摄像 机 C, 的 图 像 点 为 p,， 但 无 法 由 p, 得 
知 P 的 三 维 位 置 。 事 实 上 ，01P 连 线 上 任 














图 7.5 双 摄 像 机 观测 空间 点 示意 图 


(7. 16) 


(7.17) 


(7. 18) 
视差 ， 还 需要 


与 三 维 重 建 ， 是 指 由 两 幅 或 多 幅 二 
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意 点 的 图 像 点 都 可 认为 是 p,， 因 此 由 p, 的 位 置 ， 只 能 知道 空间 点 位 于 OP 连 线 上 的 某 一 位 
置 ， 无 法 知道 已 点 的 深度 。 如 果 用 C, 、C, 两 台 摄 像 机 同时 观察 P 点 ， 并 且 在 摄像 机 C, 图 
像 上 点 户 与 在 摄像 机 C, 图 像 上 点 p, 是 空间 同一 点 P 的 像 点 ， 则 P 了 点 的 位 置 是 惟一 确定 的 ， 
为 射线 01p, 和 0,p, 上 的 交点 。 

假定 空间 任意 点 P 在 两 台 摄 像 机 C, 与 C, 上 的 图 像 点 pi 与 p, 已 经 从 两 个 图 像 中 分 别 检 





























测 出 来 ， 即 已 知 p, 与 p, 为 空间 同一 点 P 的 对 应 点 。 假 定 双 摄像 机 已 标定 ， 它 们 的 投影 矩阵 
分 别 为 Mi 与 M,， 则 由 摄像 机 模型 
| 天 - 1 1 1 1 -| 天 
Ul mM My M3 Ma 
z1| vi |=M, = ma m2 m2 ma (7. 19) 
Z Z 
1 i le pl 
本 11 L77231 32 33 34-| 1 
到 [IX 2 2 2 2 -| 天 
Us 和 M1 My M3 Ma . 
z| v, |=M, 三 ma m2 ma ma (7. 20) 
2 2 2 2 2 2 
Ll 1 Lm Mas N33 Mg 1 











式 中 ，(wi, ,1) 与 (ww,，v，1) 分 别 为 pi 与 p, 点 在 各 自 图 像 中 的 像素 图 像 齐 次 坐标 ，(X， 
Y，Z，1) 为 已 点 在 世界 坐标 系 下 的 齐 次 坐标 ; my(k=1, 2; i=1, 2, 3; j=1, 2, 3, 4) 
为 M 的 第 i 行 第 j 列 元 素 。 上 面 两 式 分 别 包 含 三 个 方程 ， 消 去 z,、z 后 ， 可 以 得 到 关于 并 
Y、Z 的 四 个 线性 方程 ， 即 


(wm —mi)X+ (wm 一 mp ) 了 + (wma3s -m3)Z= mi — umas 





(7.21) 


(vima ma) + (vim my)Y+ (vm -ms)Z =m -vim 

(wm mi) + wm mo)Y+ wm -ms)Z = - wma 
C1222) 

(vm3 = ma) K+ vm — ma)Y+ (vm — ms)Z =ma ~ Vm 
根据 解析 几何 理论 可 知 ， 三 维 空间 的 平面 方程 为 线性 方程 ， 两 个 平面 方程 的 联 立 为 空间 
直线 方程 ( 两 个 平面 的 交 线 ) ， 式 (7.21) 和 式 (7.22) 的 几何 意义 是 过 Op 和 0,p, 的 直线 。 
由 于 空间 点 了 是 Op 和 0,p, 的 交点 ， 它 应 同时 满足 式 (7.21) 和 式 (7.22)。 因 此 ， 将 式 
(7.21) 和 式 (7.22) 联 立 求 出 点 P 坐 标 (X,，Y,，Z)。 事 实 上 ， 包含 (X,Y，2Z) 三 个 变量 的 四 

个 线性 方程 ， 可 以 用 最 小 二 乘法 求解 惟一 (X，Y，2)。 

通过 双 目 视觉 检测 空间 点 坐标 问题 的 难点 在 于 在 同一 场景 中 不 同 像 发 现 对 应 点 ， 即 匹配 
































7.4 双 目 视觉 测量 系统 精度 分 析 


7.4.1 测量 系统 结构 参数 对 测量 精度 的 影响 


1. 两 台 摄像 机 光 轴 平行 的 精度 估算 
如 图 7.6 所 示 ， 对 于 两 台 摄 像 机 光 轴 平行 ， 取 摄影 坐标 系 S,-XYZ， 其 原点 为 左 摄影 中 
心 5S,，Z 轴 与 左 主 光 轴 重合 。X 轴 为 基线 B 的 方向 。 设 图 像 坐标 系 o -xi 及 or- ， 均 与 
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S1-XY 平 行 。 某 目 标点 4 在 S,-XYZ 内 的 坐标 为 (X， » 
7Y，Z) ， 或 写作 (X，Y，- 妃 ) ， 则 存在 以 下 关系 : Ss, B 5 
和 
生机 2 Ml 
也 P dl 2 
_b Bb 02 
了 = 一 yi = (7.23) ol 全 oO> 翅 
| 
站 
a Pp iy bp 村 
或 写 为 
X x ! 2 交 
Bb 
了 二 y (7.24) Zz! 
Z 大 














、 图 7.6 两 台 摄 像 机 光 轴 平行 摄影 方式 
(1) 以 (x，y, bp) 为 观测 值 的 正直 摄影 精度 估算 ee 


如 不 考虑 摄影 基线 误差 ms 和 主 距 误差 m,， 而 仅 以 (%，y，p) 为 误差 源 ， 式 (7.23) 的 
微分 式 为 
Bu By, /HH x HN, 
pa BF) er (Fe 


ov ea 


or) 


式 中 ，(X，7，2Z) 为 目标 点 物 方 坐标 ; 中 为 摄影 基线 ; p 为 像 点 左右 视差 p = (2 -x,); (x， 
y) 为 像 点 坐标 ， 这 里 以 x 代表 和 ， 以 y 代表 和 ; /为 所 处 理 图 像 主 距 。 这 时 目标 点 物 方 空间 
坐标 可 表示 为 








3 
多 
ji 自 i 





了 Pp 
7 (7. 26) 
M,= Da 
Mz =k km, 





式 中 ,如 = 训 ， 称 为 构 形 系数 ， 它 与 目标 点 同名 光线 间 的 夹 角 有 关 ， 即 概 影 基线 越 大 、 目 标 





点 越 近 ， 忆 值 越 小 、 目 标点 测定 误差 越 小 已 = 了 ， 称 为 成 像 比 例 尺 分 母系 数 ， 即 所 处 理 的 
图 像 主 距 越 大 、 目 标点 越 近 ,及 值 越 小 、 目 标点 测定 误差 越 小 。 式 (7. 26) 有 时 还 写 为 


J 2 
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(2) W(x, Yi，Xo2 ， 入 ) 为 观测 值 的 正直 摄影 精度 估算 
当 以 (xi，yi1，%;，Y) 为 观测 值 时 ， 式 (7. 24) 可 写 为 


YX1 








和 (7. 28) 


a 
不 考虑 摄影 基线 误差 ms 和 主 距 误差 mr， 而 以 (zx ，x,，Y ) 为 误差 源 ， 式 (7.28 ) 的 微分 
式 为 


X1 一 %2 











B Bx Bx 

















dX = d d d 
MX1 一 2 (2 -x )? de 全 
Bb By, By 
dy = d dx 十 dx (7. 29 ) 
Nl 二 Yi Ve 1 (x, —x, )? 2 
Bf Bf 
dH= -— dx, + dx 
(而 SR ! (xi 一 2 ) 
或 写 为 
Xl | 
dX =k,dx, — kk, a + kik, 全 
dY =k,dy, 一 大 天 全 kk ee 
一 | Xl 丰 
207Y1 一 2 f 2 fu 


1 
转 为 中 误差 形式 ， 并 认定 m, =m,, =m, =m， 则 有 


Mm + 全 
M,=m /ke 2 人 人 "] C0 
Y= 2 十 2 


=m V2k, k, 

式 (7.26) 和 式 (7.30) 是 近景 摄影 测量 中 ， 以 正直 摄影 方式 进行 摄影 时 ， 对 精度 预先 实 
施 粗略 估算 的 常用 式 。 分 析 它 们 可 得 如 下 结论 ， 

1) 为 了 提高 精度 ， 应 尽 可 能 减 小 成 像 比 例 尺 分 母系 数 名， 尽量 拍摄 大 比例 尺 图 像 ， 即 
尽 可 能 缩短 摄影 距离 Z。 

2) 为 了 提高 精度 ， 应 使 摄影 基线 B 尽量 大 ， 

3 ) 为 了 提高 物 方 点 测定 精度 (My，My;，M;) ， 应 提高 像 点 位 置 的 质量 ， 包 括 提高 量 测 精 
度 和 去 除 影响 像 点 位 置 的 各 类 误差 。 和 m,，m, ) 应 理解 为 是 形容 位 置 质量 
的 一 种 综合 性 指标 ， 而 不 仅仅 是 测量 误差 。 

4) 一 般 情况 下 ， 远 近 方 向 的 测定 中 误差 Mj 最 大 ， 所 以 党 以 MHz = 太刀 mw 来 估算 摄影 测 
量 的 精度 。 

5 ) 知 需 考虑 基线 B 的 误差 和 等 效 焦距 了 的 误差， 应 参照 更 为 详细 的 精度 估算 式 。 千 不 能 
维持 标准 的 正直 摄影 ， 则 还 应 考虑 外 方位 角 元 素 和 外 方位 直线 元 素 误 差 的 影响 ， 还 应 参照 更 
为 详细 的 精度 估算 式 。 
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6) 有些 情况 下 ， 式 (7. 26) 可 粗略 简化 为 


My = km., 
M,; =hkm, (7. 32) 
M; =k km, 
式 (7.32) 可 粗略 简化 为 
My = My = km 
(7. 33) 
M;, =V2k km 


不 难看 出 ， 对 正直 摄影 方式 而 言 ， 一 般 有 m. >m, 或 m, >m,。 
7) 两 台 摄 像 机 的 有 效 焦距 越 大 ， 视 觉 测 量 系 统 的 测量 精度 越 高 ， 即 采用 长 焦距 镜头 容 








易 获 得 较 高 的 测量 精度 。 | 
2. 两 台 摄 像 机 光 轴 汇聚 方式 的 精度 估算 s 





假设 自 摄 站 5 与 5, 拍摄 了 有 一 交 向 摄影 图 像 对 
(Pl，P,)， 如 图 7.7 所 示 。 两 图 像 (P 、P, ) 仅 有 偏 角 ， 
分 别 为 om 与 p,。 为 了 讨论 交 向 摄影 的 精度 ， 设 有 虚拟 
的 无 倾角 图 像 对 ( PY，P') ， 图 中 未 表示 P?。 

有 og 角 的 情况 下 ,“ 水 平 " 图 像 上 点 a 与 “倾斜 "图 
像 上 点 w 的 坐标 关系 式 为 


下 (xcosp + Sinp ) 图 7.7 交 相 摄影 方法 


WO 
' cosp -xsinp 











(7. 34 ) 
Fosp 一 xsing” 
或 写 为 
1 
%, = i +ftang) 
1 一 tanp 
x 
(7.35) 
和 ] 一 ge 
f 


为 了 确 知 * 倾斜 " 图像 上 点 位 坐标 误差 对 "水 平 " 图像 上 点 位 误差 的 影响 ， 现 对 (*，y) 取 
微分 ， 有 





] 十 二 tang 

dx, = EN 
% 
1— ew 
(7.36) 

(secp)dy+ (Sane ja 

dy, = / 
1— 二 tang 
f 


推演 式 (7.36) 时 应 用 了 可 以 从 式 (7. 35 ) 直接 写 出 的 如 下 两 个 关系 式 : 
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x+fiang =%, ( 一 Ytang ] 


ysecp = 》， ( 二 Stang | 
/ 


将 式 (7. 36) 转 为 中 误差 形式 ,“ 水 平 "图 像 点 位 中 误差 (m, ，m, ) 与 “倾斜 "图像 点 位 中 
误差 (m,，m,) 的 关系 式 为 


(7.37) 


Yi, 














1 + 一 tanp 
m, a 
1 -二 tanp 
f 
， 证 (7. 38 ) 
[ (Sm 十 (7zysecp ) a 
1 -an 
根据 图 7.7， 又 有 如 下 两 个 关系 式 : 
x 
— = tana 
/ C7 0) 
7 =tan(a -9) 
故 式 (7. 38) 可 改写 为 
ee 1 +tanatang 和 
“ 1-taa(a-o)tanpg “ 
2 加 7. 40 
[San] m’ + misec'g | ; , 
1 -tan(a -9)tanp 
现 又 假设 点 4 位 于 平面 XZ 内 ， 即 认为 y,=0， 因 而 式 (7. 40) 可 简化 为 
i 1 +tanatanw py 
” 1-tan(Qw-p)tanp (7.41) 


三 Sec 
” 1-tan(a -09)tanp 


式 中 ，(m,，m, ) 为 “倾斜 "图 像 上 的 坐标 测量 中 误差 ，(m,，m, ) 实际 上 是 式 (7.30) 中 的 
(m,，m,)。 因 而 ， 在 交 向 摄影 方式 情况 下 ， 物 方 点 的 坐标 中 误差 式 为 


_ 1+tanatang |/ 可 2 2 
My cm。 /如 一 丰 刀 )+[ 太 本 任 ] 





m 











My =k, oP , (7.42) 


1 -tan(a -op)Jtanp 
1 +tanatanwp 

-tan(a -9p)tanpg “ 

现在 ， 假 设 仅 讨论 两 主 光 轴 焦点 0 的 精度 ， 如 图 7.8 所 示 。 且 已 知 





M; =V2kik, 1 


a=@p, H=lcosp, B=2lsing, ki = 万 = 本 cotg， he, 7 = tanp 
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另外 ，0 点 处 成 象 比例 尺 分 母系 数 为 Kose， 故 式 5 


f 
(7. 0 Y 写 为 
My =(1 +tan op)m, 


lcosp cotp lcosp ] [| 
x = tanw | + 
| ( 2 ff 2f 


My = (eeee Jo, 

















了 
My = x 于 (co Ce jmseeg (7. 43 ) 
/ 图 7.8 交 相 摄影 方式 精度 估计 
化 简 后 的 两 台 摄 像 机 光 轴 汇聚 方式 精度 估算 式 为 
21 
My = 7 np 
可 
My = Fm, (7.44) 
M, = . fmsep 


如 上 所 述 ， 式 (7. 44 ) 是 在 单 像 对 称 交 向 摄影 的 条 件 下 ， 讨 论 两 主 光 轴 交点 处 0 的 精度 
估算 式 。 注 意 到 ，M, 与 图 像 倾斜 角 op 的 大 小 无 关 。 
现在 研究 在 怎样 的 交 向 角 情 况 下 ， 可 使 总 误差 为 最 小 ， 即 使 


2 
Mi =m? +m +7 = min 


本 
Mw =| 迷 了 pf 
T E Fp + fF 7 pmsecp 
= [fm ]( 寺 4 一 sec? 人 ] -器 (7. 45 ) 
下 
取 式 (7. 45 ) 的 有 效 部 分 
F =3sec yp +1 二 sc = Imin (7. 46 ) 
对 w 取 导数 ， 并 令 之 为 零 
dr 1 1 
= x2secp (tanpsecg ) + x2cscp( - cotpcsco ) 
a (7.47) 
cosp sing 
即 有 
sinp -costp =(sino -cosp)(sin2po +cos2p) =0 
或 写 为 





tanzp =1,，p=45$"(p = -45° 无 意义 ) (7. 48) 
由 式 (7.48) 可 知 ， 为 使 总 误差 ML 最 小 ， 应 使 图 像 倾 斜 角 op =45"， 交 回 角 为 90"。 此 


时 ， 摄 影 昌 离 为 1， 基线 有 与 " 航 高 " 缘 为 痉 1。 并 且 ， 当 以 w = -9 = 了 = 45* 进 行 摄影 时 ， 





物 方 点 0 的 精度 按 式 (7. 43 ) 为 
/ 
My = My =M,=—m 
4 ¥ 2Z f 
即 在 (和 Y，2Z) 三 个 方向 得 到 相同 的 精度 。 
经 过 对 上 述 对 交 向 摄影 方式 精度 的 讨论 ， 得 到 如 下 绪论: 
1) 当 交 向 角 为 90° 时 ， 总 误差 最 小 ， 且 各 方向 中 误差 相等 。 


2) 为 提高 交 疝 精度 ， 应 增 大 摄影 比例 发， 提高 像 点 坐标 量 测 精度 ， 注 意 交 


方向 坐标 精度 的 影响 。 
7.4.2 ”摄像 机 焦距 对 测量 精度 的 影响 
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(7.49) 


会 角度 对 各 


为 了 获得 合适 的 三 维 视觉 测量 精度 ， 一 方面 要 求 两 台 摄 像 机 焦点 之 间 的 距离 要 尽 可 能 


、 





远 ， 即 视觉 测量 系统 的 基线 距离 尽 可 能 大 ; 另 一 方面 被 测 物 体 特征 点 的 求 取 精度 要 尽 可 能 


高 ， 一 般 要 求 达 到 亚 像素 精度 。 采 用 长 焦 摄 像 机 ( >25mm) 和 固定 基线 长 ， 很 容易 达到 1/ 
20000 的 相对 深度 误差 。 如 图 7. 9a 所 示 ， 系 统 的 深度 视觉 测量 误差 e,, .主要 与 特征 点 的 像 面 
坐标 的 求 取 精 度 5 和 两 台 摄 像 机 光 轴 之 间 的 夹 角 w 有关 ， 同 时 也 与 摄像 机 的 焦距 有 关 。 光 路 
越 长 、 深 度 误差 越 小 ， 视 场 范围 越 小 。 如 图 7. 9b 所 示 ， 要 保持 深度 误差 不 变 ， 日 不 增加 系 
统 的 体积 ， 必 须 采用 短 焦距 摄像 机 ， 同 时 特征 点 的 提取 精度 至 少 提高 一 倍 。 如 图 7. 9c 所 示 ， 
当 摄像 机 的 焦距 增加 到 两 倍 时 ， 要 维持 同样 深度 误差 和 视 场 范围 ， 则 摄像 机 的 基线 必须 增加 




















两 倍 。 












三 维 不 确定 区 域 -一 -一 


图 7.9 摄像 机 焦距 对 测量 精度 的 影响 
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7.5 双 目 视觉 系统 结构 设计 


为 了 从 二 维 图 像 中 获得 被 测 物体 特征 点 的 三 维 坐 标 ， 双 目 视 觉 测量 系 统 至 少 从 不 同位 置 
获取 包含 物体 特征 点 的 两 幅 图 像 。 它 的 一 般 结构 为 交叉 摆 放 的 两 台 摄 像 机 从 不 同 角 度 观测 统 
一 物体 。 图 7. 10 所 示 为 双 目 视觉 测量 系统 结构 ， 

只 要 能 够 从 不 同位 置 或 角度 获取 同一 物体 特征 点 
的 图 像 坐 标 ， 都 可 以 用 双 目 视觉 测量 原理 求 取 三 
维 空间 坐标 。 事 实 上 ， 获 取 两 幅 图 像 并 不 一 定 需 提 












































要 两 台 摄像 机 ， 由 一 台 摄像 机 通过 运动 ， 在 不 同 ”Ns 
位 置 观测 同一 个 静止 物体 ,或 者 由 一 台 摄像 机 加 ” J 
上 光学 成 像 方式 ， 都 可 以 满足 要 求 。 四 ~ 
7. 5.1 基于 两 台 摄像 机 的 双 目 视觉 系统 结 一 人 L 
构 1 

















对 于 采用 两 台 摄 像 机 以 光 轴 汇聚 方式 组 成 的 ”图 7. 10 双 目 视觉 测量 系统 的 结构 配置 
立体 视觉 测量 系统 ， 利 用 视差 原理 实现 三 维 测 量 
如 图 7. 11a 所 示 ， 以 往 的 双 目 视觉 测量 系统 的 结构 是 两 台 摄 像 机 斜 置 于 基 座 上 ， 中 间 放 置 电 
路 板 ， 照 明光 源 放 在 中 间 前 部 。 这 种 传统 设计 有 许多 不 合理 的 地 方 ， 由 于 基线 距 是 两 台 摄 像 
机 的 镜头 中 心 的 距离 ， 因 此 实际 基线 距 B 比 视觉 系统 的 横向 宽度 工 要 小 许多 ; 照明 系统 是 
固定 的 ， 对 于 某 些 测 量 对 象 不 适用 ; 电路 板 用 螺钉 固定 在 基 座 上 ， 维 修 不 方便 ， 往 往 要 拆 下 
整个 视觉 系统 ， 使 得 维修 后 必须 重新 标定 。 





















































a) 传统 双 目 传感器 结构 b) 改进 双 目 传感器 


图 7.11 基于 两 台 摄像 机 的 双 目 系统 结构 

如 图 7. 11b 所 示 ， 两 台 摄 像 机 反 向 放置 ， 在 摄像 机 前 面 各 摆 放 一 个 平面 反射 镜 ， 用 来 调 
整 摄像 机 的 测量 角度 。 这 种 结构 实际 上 用 两 台 摄 像 机 成 像 ， 在 有 限 空间 内 增 大 了 系统 基线 距 
B 的 值 ， 而 系统 的 体积 并 不 发 生 显著 变化 。 同 时 ， 照 明 系 统 采用 分 体式 设计 ， 可 以 固定 在 系 
统 外 面 的 任何 位 置 ， 以 任意 角度 为 测量 提供 照明 。 同 传统 设计 相 比 ， 在 系统 横向 尺寸 保持 不 
变 的 情况 下 ， 改 进 结构 使 之 具有 更 大 的 基线 距 B， 能 得 到 更 高 的 测量 精度 ， 而 且 纵 向 尺寸 大 
大 缩短 ， 整 个 系统 的 体积 更 小 、 重 量 更 轻 、 便 于 固定 。 


7. 5.2 ”基于 单 台 摄像 机 的 双 目 视觉 系统 结构 
1. 摄像 机 移动 ， 构 成 双 目 视觉 系统 
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保持 目标 物 不 动 的 移动 摄像 机 法 ， 是 近景 摄影 测量 中 常用 的 方法 。 测 量 中 绝 大 多 数目 标 





物 不 能 移动 或 不 宜 移动 。 

如 图 7. 12 所 示 ， 当 摄像 机 位 于 位 置 1 和 位 置 
2 时 ， 分 别 采 集 包含 物体 特征 点 的 图 像 。 两 幅 图 
像 可 以 组 成 正直 摄影 立体 像 对 ， 这 时 摄像 机 位 置 
的 变动 应 保持 基本 平移 性 质 ， 即 摄像 机 仅仅 沿 着 
x 方向 移动 ， 沿 其 他 方向 没有 移动 和 转动 。 系 统 
的 基线 距 B 与 摄像 机 的 移动 距离 相关 。 如 果 摄 像 
机 事先 移动 的 两 个 位 置 确 定 下 来 ， 该 系统 只 需要 
一 次 标定 ， 即 可 构成 双 目 视觉 测量 系统 。 两 幅 图 
像 也 可 组 成 交 向 摄影 立体 像 对 ， 这 时 摄像 机 位 置 
的 变动 是 移动 加 转动 ， 摄 像 机 需要 重新 标定 。 

这 种 结构 的 特点 如 下 : 












































图 7. 12 





摄像 机 移动 构成 双 


目 视觉 系统 





1) 采 用 单 摄像 机 ， 降 低 了 系统 的 成 本 ; 根据 摄像 机 移动 位 置 的 不 同 ， 很 容易 构成 不 同 


基线 距 的 双 目 视觉 测量 系统 ， 具 有 很 大 的 灵活 性 。 

2) 这 种 结构 对 摄像 机 的 移动 位 置 要 求 较 高 ， 尤 其 
是 移动 的 固定 位 置 。 

3 ) 因为 摄像 机 在 两 个 位 置 的 固定 是 在 测量 过 程 中 
进行 的 ， 因 此 测量 速度 不 可 能 很 快 。 对 于 要 求 在 线 测 
量 的 应 用 场合 ， 这 种 结构 显然 不 能 满足 要 求 。 

2. 摄像 机 国定 ， 被 摄 物 移动 构成 双 目 视觉 系统 

即 保持 摄像 机 不 动 ， 移 动 被 测 目 标 。 如 图 7. 13 
所 示 ， 自 摄 站 5 对 目标 M 拍摄 一 张 图 像 P, 后 ， 保 持 


























(Pi, P2) 


摄像 机 $ 不 变 ， 将 被 摄 物 M 从 位 置 M, 平移 至 M,， 再。 图 7 13 移动 被 摄 物体 法 获取 立体 像 对 


拍摄 另 一 图 像 P,， 以 组 成 立体 像 对 (P|，P, ) 。 


被 摄 物 M 的 平移 距离 B 相当 于 摄影 基线 。 在 近景 摄影 测量 的 立体 摄影 中 ， 当 移动 目标 


较 移 动 摄像 机 更 为 方便 时 ， 常 采用 此 方法 。 如 工厂 传 
送 带 上 对 部 件 进行 质量 控制 是 一 种 典型 例子 ， 可 方便 
地 对 传送 带 上 不 断 平移 过 来 的 众多 部 件 一 一 进行 立体 
摄像 。 


7.5.3 同一 物镜 法 


立体 摄影 的 同一 物镜 法 是 在 单个 摄像 机 的 物镜 前 
方 设置 一 对 平面 镜 光 学 元 件 ( 或 直角 棱镜 ) ， 如 网 
7. 14 所 示 。 通 过 同一 物镜 ， 把 同一 底片 分 成 左右 两 
半 ， 形 成 立体 影像 。 这 相当 于 传统 的 由 两 台 摄 像 机 组 
成 的 双 目 视觉 ， 从 两 个 不 同位 置 获取 被 测 物体 的 两 幅 
图 像 ， 因 此 具有 双 目 视觉 测量 的 功能 。 




















图 7.14 同一 物镜 法 获得 立体 像 对 
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7.6 ”运动 物体 的 同步 摄影 方法 


运动 物体 三 维 空间 运动 参数 的 测定 ， 在 其 二 维 影像 获取 阶段 ,需要 两 台 或 两 台 以 上 高 速 
摄像 机 ( 或 摄影 机 ) 同步 拍摄 。 

首先 ， 要 把 同一 瞬间 拍摄 的 一 对 立体 像 对 寻找 出 来 ， 再 对 这 些 同 一 瞬间 拍摄 的 立体 像 
对 ， 经 过 图 像 处 理 和 拍摄 测量 处 理 ， 测 定 出 该 时 刻 某 些 点 位 的 三 维 空间 坐标 ， 结 合 时间 信 息 
获得 四 维 空间 信息 。 

不 同类 型 的 被 测 运动 物体 对 同步 摄影 精度 的 要 求 是 极 不 相同 的 。 它 与 运动 物体 、 运 动物 
体 的 运动 速度 和 高 速 摄像 机 的 距离 、 高 速 摄像 机 的 拍摄 速度 密切 相关 。 

1. 同步 快门 

同步 快门 有 一 般 同步 快门 和 电子 同步 快门 两 种 。 一 般 同步 快门 分 机 械 同步 快门 和 电磁 铁 同步 
快门 。 机 械 同步 快门 手动 同步 ， 电 磁铁 快门 由 电源 控制 同步 。 另 外 ， 一 般 还 配 有 快门 线 。 

电子 快门 通过 附加 电路 安装 在 CCD 摄像 机 或 高 速 摄像 机 上 。 其 同步 精度 高 ， 不 受 距离 限制 。 

2. 计时 装置 

现代 的 高 速 摄 像 机 (或 高 速 摄影 机 ) 配 备 有 用 于 记录 曝光 时 刻 的 计时 装置 (时 标 装置 ) ， 
以 脉冲 方式 将 时 间 信 号 记录 在 底片 或 影像 上 。 

3. 闪光 照明 

闪光 照明 法 一 般 用 在 处 于 昏暗 背景 的 被 测 物体 。 在 两 台 摄像 机 快门 均 处 于 打开 状态 下 ， 
以 某 种 类 型 的 闪光 灯 照 明 运 动物 体 。 通 过 多 幅 立 体 像 对 的 拍摄 测量 处 理 ， 即 可 获得 运动 物体 
的 运动 状态 。 

er neni 可 在 摄影 过 程 中 ， 可 把 闪光 灯 放 置 在 被 测 物体 附近 并 面 对 
摄像 机 。 在 开始 、 结 束 和 高 速 摄影 过 程 中 ， 开 启 闪 光 灯 数 次 ， 使 内 光亮 点 构 像 在 图 像 上 ， 借 
此 寻找 同名 景 有 

4. 同一 物镜 法 

根据 7.5.3 节 所 述 ， 可 以 看 出 立体 摄影 的 同一 物镜 法 同步 性 最 为 可 靠 。 根 据 6.3.4 节 的 
关于 基线 距离 分 析 ， 可 知 通过 改变 两 组 平面 镜 的 排放 角度 ， 就 可 以 改变 基线 的 距离 。 这 样 既 
增 大 基线 距离 ， 又 不 改变 视觉 测量 系统 体积 。 另 外 ， 对 物体 特征 点 的 三 维 测量 ， 只 需 一 次 采 
集 ， 就 可 以 获得 物体 特征 点 的 两 幅 图 像 ， 从 而 提高 测量 速度 。 总 之 ， 同 一 物镜 法 具有 成 本 
低 、 结 构 灵 活 和 测量 速度 快 的 优点 。 

同一 物镜 法 最 大 缺点 是 ， 由 于 一 幅 图 像 包 含 了 被 测 物 体 特征 点 的 两 幅 图 像 ， 图 像 视差 减 
小 了 1/2， 因 此 视觉 系统 的 测量 范围 减 小 了 1/2。 且 在 图 像 的 中 央 是 两 幅 图 像 的 相交 处 ,不 
可 用 。 而 对 一 台 摄 像 机 来 说 ， 图 像 中 央 应 该 是 成 像 质 量 最 好 的 、 光 学 畸变 最 小 的 地 方 。 


7.7” 双 目 视觉 测量 系统 标定 

























































































双 目 视觉 测量 系统 的 标定 主要 是 指 摄像 机 内 部 参数 标定 后 ， 确 定 视觉 系统 结构 参数 R 
和 了。 常规 方法 是 采用 二 维 或 三 维 精密 靶 标 ， 通 过 摄像 机 的 图 像 坐标 与 三 维 世 界 坐标 的 对 应 
关系 求 得 这 些 参数 。 
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实际 上 ， 在 双 目 视觉 测量 系统 的 标定 方法 中 ， 是 由 标定 靶 标 对 两 台 摄 像 机 同时 进行 摄像 
机 摄像 标定 ， 以 分 别 获得 两 台 摄 像 机 的 内 、 外 参数 ， 从 而 不 仅 可 以 标定 出 摄像 机 的 内 部 参 
数 ， 还 可 以 同时 标定 出 双 目 视觉 测量 系统 的 机 构 参数 。 

在 对 每 台 摄像 机 单独 标定 后 ， 可 以 直接 求 出 摄像 机 之 间 的 旋转 矩阵 丸和 平移 矢量 了。 但 
由 于 标定 过 程 中 存在 误差 ， 此 时 得 到 的 关系 矩阵 并 不 是 很 准确 。 为 了 进一步 提高 精度 ， 可 以 
通过 对 匹配 的 特征 点 用 三 角 法 重建 ， 比 较 与 真实 坐标 之 间 差 异 构造 误差 矢量 ， 采 用 非 线性 优 
化 算法 对 标定 结果 进一步 优化 。 具 体 过 程 如 下 : 

如 图 7.15 所 示 ，Ow-XwYwZw 为 世界 坐标 系 ，O1-XLYLZi、On-XaYrZr 分 别 为 左 、 石 摄 
像 机 坐标 系 。 考 虑 空间 中 一 点 P， 在 世界 坐标 系 中 坐标 矢量 为 X,， 在 左 、 右 摄像 机 坐标 系 
中 坐标 矢量 分 别 为 对 ,.、 竺 :。 这 样 它 从 世界 坐标 系 分 别 变 换 到 到 左 、 右 摄像 机 坐标 系 的 关系 
为 




















X, =R,X, +T, 


























(7. 50) 
Xn = RX + Th 
这 样 ， 从 左 摄 像 机 到 右 摄像 机 的 关系 为 
Xx, =RX, + 了 (7.51) 
式 中 ,R=RiR7'; T=Ti -RT,。 
图 7.15 立体 摄像 机 系统 标定 示意 图 
得 到 摄像 机 之 间 的 旋转 矩阵 R 和 平移 矢量 了 后 ， 可 以 利用 关系 式 
Zip! =X 
(7. 52) 
Zrps = Xr 


进行 三 维 重建 ， 其 中 p, 、P 分 别 是 点 了 在 左右 图 像 中 的 坐标 矢量 。 

得 到 点 P 的 三 维 坐标 矢量 估计 值 P,,,， 就 可 以 与 已 知 的 真实 值 P,,. 比 较 , 令 误 差 拓 量 。 
= >》 | P,。 - P| ， 选 用 合适 的 优化 算法 (例如 ILM 优化 算法 ) ， 就 可 以 得 到 更 加 准确 的 摄 
像 机 内 外 部 参数 。 由 于 标定 时 充分 考虑 了 摄像 机 之 间 的 关系 ， 因 此 重建 精度 比 由 每 台 摄 像 机 


单独 标定 的 重建 精度 更 高 。 
立体 匹配 中 ， 经 常 希望 使 得 图 像 间 匹 配点 保持 在 同一 扫描 行 上 ， 从 而 使 对 应 点 的 搜索 从 
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二 维 空 间 降 为 一 维 空间 ， 从 而 大 大 简化 对 应 点 搜索 工作 ， 并 且 提 高 匹配 可 靠 性 。 得 到 摄像 机 
之 间 的 关系 矩阵 丸和 平移 矢量 了 后 ， 很 容易 就 可 以 通过 旋转 平移 左右 摄像 机 坐标 系 的 方法 
使 摄像 机 之 间 得 到 平行 光 轴 的 标准 配置 。 这 一 过 程 通常 称 为 立体 校正 。 


7.8” 双 目 视觉 测量 系统 立体 匹配 方法 概述 














7.8.1 立体 匹配 技术 


双 目 视觉 测量 是 建立 在 两 台 摄像 机 分 别 摄取 的 两 幅 图 像 对 应 基 元 的 视差 基础 之 上 的 ， 因 
此 确定 两 幅 图 像 中 各 基 元 之 间 的 匹配 关系 是 双 目 视觉 测量 系统 最 关键 和 极 定 挑战 性 的 一 步 。 
立体 匹配 就 是 在 两 幅 图 像 的 匹配 基 元 之 间 建 立 对 应 关系 的 过 程 。 这 里 的 匹配 基 元 主要 指 几 何 
基 元 ， 可 以 是 区 域 、 也 可 以 是 边缘 等 特征 基 元 。 与 普通 的 图 像 严 配 、 图 像 配 准 不 同 ， 立 体 像 
对 之 间 的 差异 是 由 摄像 时 两 台 摄像 机 观察 点 不 同 造 成 的 ， 而 不 是 景物 变化 、 场 景 运动 等 因素 
引起 的 。 根 据 匹配 基 元 的 不 同 ， 立 体 匹配 可 分 为 区 域 匹配 和 特征 匹配 两 类 。 

区 域 匹配 也 称 为 稠密 匹配 ， 旨 在 为 每 个 像素 确定 对 应 像素 ， 建 立 稠密 对 应 场 。 稠 密 对 应 
场 往往 呈 规 则 分 布 ， 通 常 直接 以 岁 像 像素 网 格 为 参照 ， 不 同 网 格 之 间 邻 接 关 系 简 单 明 了 ， 易 
于 描述 ， 便 于 在 立体 匹配 过 程 中 利用 。 此 类 方法 直接 把 图 像 的 像素 值 作为 匹配 特征 ， 以 基准 
图 ( 双 目 视觉 立体 像 对 中 的 一 幅 图 像 ) 的 待 匹 配点 为 中 心 创 建 一 个 窗口 ， 用 待 匹 配点 邻 域 像 
素 的 灰 度 值 分 布 来 表征 该 像素 ; 然后 在 对 准 图 ( 双 目 视觉 立体 像 对 中 的 另 一 幅 图 像 ) 寻找 相 
应 的 像素 ， 以 其 为 中 心 创建 同样 的 窗口 ， 并 用 其 邻 域 像素 的 灰 度 值 分 布 来 表征 它 ， 当 两 者 之 
间 的 相似 性 满足 一 定 的 条 件 ， 则 表明 基准 图 和 对 准 图 中 的 这 两 个 像素 是 匹配 的 ， 可 能 是 三 维 
空间 同一 点 分 别 在 两 个 视觉 传 感 带 成 像 面 上 所 成 的 像 点 。 基 于 区 域 的 匹配 方法 可 以 得 到 致密 
的 视差 图 ， 但 实际 应 用 中 如 何 选择 匹配 窗口 并 没有 统一 的 准则 。 

寺 征 匹配 也 被 称 为 稀 琉 匹配 ， 旨 在 建立 稀 斑 图 像 特征 之 间 的 对 应 关系 。 一 方面 ， 稀 琉 特 
征 的 不 规则 分 布 给 特征 之 间 相 互 关系 的 描述 带 来 困难 ， 不 利于 匹配 过 程 中 充分 利用 此 类 信 
息 。 男 一 方面 , 稀 琉 特征 的 不 规则 分 布 给 三 维 场景 的 描述 带 来 困难 ， 往 往 需 要 进行 后 处 理 以 
确切 描 述 三 维 场 景 。 后 处 理 通常 取 稀 琉 特 征 为 数据 点 ， 采 用 内 插 方法 建立 稠密 对 应 场 ， 或 者 
采用 拟 合 方法 确定 一 些 先 验 几 何 模型 的 自由 参数 ， 实 现 几 何 模型 的 重建 。 内 插 和 拟 合 方法 以 
稀 玻 特征 为 数据 ， 结 果 直 接 依赖 于 稀 玻 特征 对 应 ， 不 可 靠 的 特征 对 应 往往 会 产生 不 理想 的 结 


7.8.2 ”稠密 匹配 方法 剖析 


随 着 研究 不 断 深入 ， 人 们 对 各 种 立体 匹配 方法 认识 不 断 提高 ，Scharstein 和 Szeliski 对 立 
体 匹 配 算法 进行 了 总 结 ， 认 为 稠密 立体 匹配 方法 通常 都 具有 四 个 步骤 : 匹配 代价 计算 (Matc- 
hing Cost Computation ) 、 匹 配 代价 累 积 ( Cost Aggregation ) 、 视 差 计 算 或 优化 (Disparity Compu- 
tation/Optimization ) 、 视 差 精 细 化 处 理 ( Disparity Refinement) 。 将 匹配 方法 前 分 为 相对 独立 的 
四 个 模块 ， 并 根据 不 同 算法 在 每 一 步骤 的 不 同 处 理 进 行 分 类 。 下 面 将 这 四 个 步骤 作 简 要 介 
绍 。 


(1) 匹配 代价 计算 
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根据 图 像 中 对 应 像素 的 颜色 或 灰 度 计算 匹配 单元 之 间 的 匹配 代价 。 由 于 图 像 间 存在 全 局 
亮度 变化 (如 ， 增 益 和 上 曝光 差异 等 ) 和 局 部 亮度 变化 (如 渐 晕 、 非 于 人 表面 和 照明 变化 等 ) 及 
噪声 等 因素 ， 设 计 一 种 合适 的 匹配 代价 并 不 容易 。 常 见 的 匹配 代价 有 灰 度 差 的 二 次 方 ， 灰 度 
差 的 绝对 值 ， 归 一 化 的 自 相 关系 数 等 。 

(2) 匹配 代价 积 办 

它 是 指 将 周围 像素 的 匹配 代价 积聚 到 中 心 像素 的 匹配 代价 上 。 实 际 上 ， 这 一 步 假设 支持 
区 域内 像素 具有 相同 视差 ， 然 后 在 支持 区 域内 对 匹配 代价 进行 平均 处 理 以 减少 噪声 等 因素 的 
影响 ， 以 此 反映 相 邻 像素 的 相互 作用 。 一 种 方式 取 长 方形 或 正方 形 窗口 的 支持 区 域 ， 并 直接 
以 支持 区 域内 匹配 代价 的 平均 值 作为 积聚 结果 。 如 果 支 持 区 域 跨越 物体 边缘 ， 黎 盖 不 同 物 
体 ， 平 均 处 理 将 导致 不 正确 的 结果 。 为 此 ， 人 们 要 设计 移动 窗口 及 自 适应 尺寸 窗口 的 支持 区 
域 。 

(3) 视差 计算 和 优化 

根据 匹配 代价 计算 每 个 像素 的 视差 ， 确 定 视 差 场 。 局 部 方法 侧重 匹配 代价 计算 和 代价 积 
聚 。 这 一 阶段 仅仅 取 对 应 于 最 小 匹配 代价 的 视差 作为 计算 结果 。 全 局 方法 则 往往 跳 过 匹配 代 
价 积聚 ， 采 用 图 像 视差 场 的 整体 约束 表达 相 邻 像素 的 相互 作用 。 根 据 约束 范围 ， 可 分 为 一 维 
和 二 维 优化 方法 。 一 维 优化 方法 针对 每 条 扫描 行 施加 约束 ， 构 造 优 化 目标 函数 ， 所 构造 目标 
函数 可 以 使 用 动态 规划 方法 进行 优化 。 这 类 方法 针对 不 同 扫描 行 独立 进行 优化 ， 忽 略 相 邻 扫 
描 行 之 间 的 相互 作用 ， 相 邻 扫描 行 的 视差 计算 结果 存在 明显 的 不 一 致 现象 。 二 维 优化 则 针对 
整 幅 图 像 的 视差 场 施加 整体 约束 ,构造 优 化 目标 函数 ， 模 拟 不 同方 向 上 相 邻 像素 的 相互 作 
用 ,弥补 一 维 优化 方法 的 缺陷 ,但 所 构造 目标 函数 的 优化 比较 困难 。 

(4) 视差 精细 化 处 理 

对 上 述 视差 计算 结果 作 精 确 调整 。 一 方面 ， 利 用 上 一 阶段 计算 得 到 的 视差 场 ， 采用 内 
插 、 拟 合 等 方法 重新 估计 每 个 像素 的 视差 值 ， 以 达到 子 像素 级 别 的 精度 。 另 一 方面 ， 作 后 续 
处 理 ， 包 括 遮 挡 像素 的 检测 及 其 视差 的 恢复 等 。 一 般 来 说 ， 调 整 之 后 的 视差 场 能 够 更 加 准确 
地 反映 真实 视差 场 。 


7. 8.3 ”特征 匹配 方法 剖析 


在 提取 图 像 显著 特征 的 基础 上 ， 特 征 匹 配 旨 在 建立 这 些 稀 焉 特征 之 间 的 对 应 关系 。 不 同 
的 基于 特征 的 匹配 方法 所 选择 的 匹配 基 元 各 不 相同 。 可 以 用 作 匹 配 基 元 的 图 像 特征 包括 零 交 
又 、 直 线段 、 曲 线段 、 区 域 等 。 由 于 所 使 用 的 匹配 基 元 各 不 相同 ， 导 致 所 使 用 的 匹配 准则 不 
同 。 但 是 ， 特 征 匹配 的 方法 只 能 得 到 相应 基 元 特征 处 的 景物 深度 值 ， 为 了 重建 可 视 表 面 还 必 
须 进 行 深度 的 内 插 操 作 。 

近 几 年 ， 由 于 基于 局 部 不 变量 的 特征 提取 方法 的 进步 ， 特 征 匹配 逐渐 以 特征 点 匹配 为 主 
流 。 一 方面 ， 是 得 益 于 特征 提取 方法 的 进展 ， 即 使 图 像 特征 在 不 同 图 像 存在 比例 缩放 或 仿 射 
变换 等 现象 时 ， 特 征 点 匹配 方法 也 能 实现 两 幅 图 像 的 可 靠 匹配 。 此 性 质 对 改善 宽 基线 匹配 结 
果 特 别 有 用 。 因 为 在 宽 基 线 情况 下 ， 由 于 图 像 视点 变化 比较 大 ， 使 得 同一 场景 在 不 同 视点 下 
的 投影 出 现 比较 大 的 变化 。 特 别 是 对 一 些 斜 面 场景 的 图 像 对 ， 这 种 情况 更 加 严重 。 通 常 基于 
局 部 匹配 的 算法 在 此 区 域 很 容易 造成 误 匹 配 。 因 此 ， 这 样 就 对 特征 提取 的 算法 提出 了 较 高 要 
求 ， 希望 提取 的 特征 能 够 具有 光照 、 旋 转 、 尺 度 和 反射 不 变性 。 在 现 有 的 特征 提取 算法 中 ， 
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尺度 不 变 特 征 变换 (Scale Invariant Feature Transform，SIFT) 算 法 由 于 其 良好 的 性 能 得 到 了 广 
泛 应 用 。 图 7. 16 所 示 是 对 标准 图 像 对 ， 即 Teddy 图 像 中 斜面 场景 ， 利 用 SIFT 算法 提取 特征 
并 进行 匹配 得 到 的 结果 。 从 图 中 可 以 看 出 ， 由 于 该 斜面 的 视差 相对 较 大 ， 使 得 在 左右 图 像 
中 ， 对 应 点 附近 的 图 像 变 化 较 大 ， 如 果 利 用 局 部 匹配 算法 的 代价 累积 策略 ， 将 会 造成 误 匹 
配 。 而 利用 SIFT 算法 进行 特征 匹配 ， 则 不 会 造成 这 一 问题 。 


和 一 re 
eit ET Le 











a) 左 图 像 特征 提取 结果 
mm 
b) 右 图 像 特征 提取 结果 
2 i Tm 





9) 特征 匹配 结果 














图 7.16 利用 SIFT 算法 对 Teddy 图 像 中 斜面 场景 
进行 特征 提取 和 特征 匹配 的 处 理 结 


7.9 双 目 视觉 测量 系统 常用 约束 条 件 

















7.9.1 约束 规则 


事实 上 ， 利 用 视差 的 概念 进行 三 维 测量 的 思想 可 以 用 三 角 测 量 的 原理 进行 说 明 。 如 图 
7.17 所 示 , 设 P 是 空间 中 的 一 个 物 点 ，0 和 0' 分 别 是 左 、 右 摄像 机 的 光学 中 心 。 由 几何 知 
识 可 知 ， 以 了 P、0 和 0' 三 点 为 顶点 可 以 构成 一 个 三 角形 ， 它 们 确定 空间 中 的 一 个 平面 7。 若 
Pr 和 Pr 分 别 为 物 点 PP 在 左 、 右 图 像 平面 上 的 投影 像 ， 则 由 透视 投影 的 有 关 结 论 可 知 ， 物 点 
P 必定 在 左 摄像 机 的 光学 中 心 的 0 和 投影 像 Pr 的 连 线 0Pr 上 。 同 理 可 知 ， 物 点 已 必定 在 右 
摄像 机 的 光学 中 心 0' 和 投影 像 P 的 连 线 0'P* 上 。 这 样 ， 直线 0P! 和 0' 严 均 在 由 P、0 和 
0' 三 点 确定 的 平面 7 上。 由 于 处 于 空间 中 同一 个 平面 上 的 两 条 非 平 行 直线 惟一 地 确定 平面 
上 的 一 点 ， 因 此 物 点 已 由 上 述 两 直线 OP; 和 0'P? 的 交点 给 出 。 

上 述 基 于 双眼 视差 的 测量 方法 在 概念 上 非常 简洁 明快 。 只 要 能 够 确定 一 个 物 点 在 左 、 石 
图 像 平面 上 对 应 的 像 点 位 置 ， 即 可 据 此 惟一 地 确定 该 物 点 的 三 维 空间 位 置 。 问 题 在 于 怎样 才 
能 确定 和 左 图 像 平面 上 的 某 个 像 点 所 对 应 的 右 图 像 平面 上 的 某 个 像 点 呢 ? 

由 于 噪声 、 光 照 变化 、 谈 挡 、 透 视 畸 变 和 目标 之 间 本 身 的 相似 性 等 因素 ， 导 致 空 间 同 一 
点 投影 到 两 台 摄 像 机 的 图 像 平面 上 形成 的 对 应 点 的 特性 不 同 。 对 一 幅 图 像 中 的 一 个 特征 点 或 
一 小 块 子 图像 ， 在 男 一 幅 图 像 中 可 能 存在 好 几 个 相似 或 更 多 的 候选 匹配 。 因 此 ， 必 须 通 过 必 
要 的 信息 或 约束 规则 作为 辅助 判 据 ， 以 便 得 到 惟一 准确 的 匹配 。 
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图 7.17 双 目 视觉 系统 的 基本 几何 约束 





7.9.2 外 极限 约束 


假定 仅 有 关于 物 点 的 投影 像 的 观测 数据 可 以 利用 。 显 然 ， 在 观测 到 图 像 平 面 上 一 个 像 点 
时 ， 由 前 面 的 讨论 可 知 ， 与 该 像 点 相对 应 的 物 点 必定 满足 下 面 的 外 极限 约束 条 件 。 

左 图 像 平面 上 的 某 个 像 点 Pr 在 右 图 像 上 的 对 应 点 Zz 400 D 
Pi 必定 在 由 左 图 像 中 过 像 点 Pr 的 视线 和 右 摄像 机 的 + \ 
光学 中 心 0' 所 确定 的 平面 7 和 右 图 像 平 面 上 的 交 线 工 , 
下 

















为 方便 起 见 ， 称 所 述 交 线 请 为 外 极 线 ( Epi - polar 
Line) ， 所 述 平面 为 外 极 平面 。 根 据 外 极 约束 可 知 ， 
为 了 在 右 图 像 上 找到 与 Pr 相对 应 的 PP， 不 必 在 整个 
右 图 像 上 进行 探索 ， 而 只 须 沿 相 应 的 外 极 线 进行 探索 
即 可 。 这 样 做 可 以 大 大 减少 探索 空间 ， 从 而 大 大 缩短 
探索 的 时 间 。 

设 定 左 摄像 机 0-xyz 位 于 世界 坐标 系 原点 且 无 旋 
转 ， 图 像 坐标 系 为 0 -X,Y ， 焦 距 为 f; ; 右 摄像 机 坐 图 7.18 双 目 测量 原理 
标 系 为 On-xaynzn ， 图 像 坐 标 系 为 0' -XsYs ， 焦 距 为 f;， 双 目测 量 原理 如 图 7. 18 所 示 。 
根据 摄像 机 透视 变换 模型 有 


XY YR 














XL [fi SL uro ” hy hh, hs hs ™ ™ 
R ty y y 
Zi Y= 0 fi vip 0 1 | 。 =|h hj hs ed (7. 53 ) 
1」L0 0 1 1| La po hh hi 1 
瑟 为 其 投影 矩阵 ， 同 理 设 右 摄像 机 的 投影 抢 阵 为 
记 页 


万 ' = hy hy hl hy 
hs ho hn hs 
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由 两 台 摄 像 机 的 关系 得 到 
ho Kh ho-Xho hs-Xh, Xih, -ho 
hs Kh, ho-Xho h-hh ll” | | xh,-h, 
y|= (7. 54) 
hr’ Xahy hr Xahs hy Xah, Xih he 
hy Xahy hr Xahsy hl Xah, 。 Xih hy 
方程 组 中 有 3 个 未 知 数 和 4 个 方程 。 求 该 超 定 方程 的 最 小 二 乘 解 即 可 得 到 (x，y，z) 。 
当 已 知 两 台 摄像 机 的 内 参数 及 空间 点 在 左 、 右 摄像 机 所 拍摄 图 像 中 的 图 像 坐 标 后 ， 即 可 
按照 上 述 方法 得 到 被 测 点 的 三 维 坐标 。 
但 是 在 实际 应 用 中 ， 摄 像 机 的 成 像 模型 并 非 理 左 像 平面 公 重 线 C 





























想 的 小 孔 成 像 模型 ， 而 图 像 匹 配点 的 确定 和 标定 过 S 全 
程 都 会 引入 微小 的 误差 ， 这 使 得 图 7. 19 所 示 的 两 条 
直线 可 能 不 会 相交 。 由 于 这 两 条 直线 不 可 能 平行 ， “ 
只 能 是 异 面 直线 。 这 两 条 直线 无 交点 时 ， 上 述 方程 模型 点 TM 
组 无 解 ， 无 法 确定 点 4 的 空间 坐标 。 为 解决 这 种 问 
后 人 生计 计算 室 间 上 的 人 村 相克 直线 Ha 和 
可 视 为 公 重 线 长 度 为 零 的 特殊 异 面 直线 。 
如 图 7. 19 所 示 ， 假设 两 条 异 面 直线 六、 户 方向 图 7 19 公 重 线 原理 





矢量 为 1 、， 点 m, 、m 分 别 为 两 条 异 面 直线 上 的 
点 。 当 | muma || 值 最 小 时 ，mima 即 为 两 条 异 面 直线 的 公 重 线 。 六 (mi +m ) 为 公 重 线 中 点 
的 坐标 。 由 异 面 直 线 的 公 重 线 和 蜡 面 直线 的 关系 可 以 得 到 


一 一 ”一 一 
“1 














Ey (7.55) 
ni * Pm; =0 
即 
+BL,)) :1 =0 (7. 56) 
((Pi+ali)-(P,+Bl,)) :Lb,=0 
求解 方程 得 到 位 置 系数 a、B 为 
_(P, -P.) “1 -((P,-P.) “L,) M (L “L,) 
i 1-(L “)? 
(7.57) 
_((P,-P.) “1,) “ (4 “1,) - (P, -P.) “六 
a 


带 入 公 垂 线 的 直线 方程 中 ， 求 | mm | 的 大 小 。 如 果 | mm | 小 于 设 定 的 阔 值 ， 则 可 认为 
空间 点 的 坐标 为 于 (mi + ms)。 

显而易见 ， 立 体 视 法 成 败 的 关键 在 于 能 否 在 左 、 右 图 像 平面 上 找到 各 自 的 像 点 的 对 应 
点 。 虽然 上 述 外 极 约束 提供 了 一 个 很 有 用 的 探索 工具 ， 可 以 帮助 减少 探索 空间 。 但 遗憾 的 


是 ， 外 极 约 束 本 身 并 不 保证 一 定 能 够 惟一 地 在 左 、 右 图 像 平 面 上 找到 各 自 像 点 的 对 应 点 。 为 
了 减少 误 对 应 ， 还 需要 引入 其 他 约束 条 件 。 下 面 ， 对 其 中 较 重 要 的 几 个 约束 条 件 做 一 个 简单 
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介绍 。 


7.9.3 ”其 他 约束 条 件 


立体 匹配 成 为 立体 视觉 难点 的 原因 就 是 ， 在 寻找 对 应 点 时 很 可 能 存在 多 个 候选 点 。 怎 样 
缩小 匹配 搜索 空间 和 怎样 尽量 减少 候选 点 就 成 为 立体 匹配 首先 要 解决 的 问题 。 基 于 多 约束 的 
立体 匹配 算法 的 出 发 点 也 正在 于 此 。 这 样 ， 特 征 点 的 匹配 搜索 区 域 大 大 缩小 ， 这 样 不 但 可 减 
少 计算 量 ， 而 且 还 能 减少 误 匹 配 ， 从 而 利用 比较 准确 的 特征 点 获得 视差 图 。 

假设 存在 相对 旋转 和 位 移 的 左 、 右 摄像 机 对 同一 场景 产生 图 像 对 f(x, y) 和 /f(x,y)， 
它们 的 特征 点 集 分 别 为 

Pr: {Pr=(x, y)1i=1, 2, %, Ni}, PY: PE=( yo)1i=1, 2, 1%, Nel 
式 中 ，P"、P" 为 有 、fi 对 应 的 特征 点 集 ; N 、N 为 各 自 的 特征 点 数目 ,通常 情况 下 产 m 
P" 关 W@W。 特 征 点 匹配 就 是 要 找 出 点 集中 由 同一 场景 点 或 物 点 产生 的 特征 点 对 。 建 立 匹配 矩 阵 

M=[m;| me (0, 1); i=1, 2, ,Ni; j=1, 2,…, Nx]， 如 果 Pr 和 Pr 匹配， 
那么 my =1， 否 则 为 0。 

除了 外 极 几 何 约束 外 ， 还 有 几 个 在 匹配 过 程 中 比较 常用 的 约束 条 件 ， 以 确定 匹配 矩阵 元 
素 mw 的 值 ， 即 确定 对 应 点 是 否 匹 配 。 这 些 约束 条 件 是 根据 匹配 环境 所 作 的 一 些 假设 ， 主 要 
包括 以 下 几 点 。 

1. 相 容 性 约束 

相 容 性 约束 意味 着 对 应 的 特征 应 有 相同 的 属性 ， 它 的 具体 含义 随 所 选用 的 特征 及 其 属性 
不 同 而 有 所 不 同 。 如 果 左 图 像 平面 上 的 像 点 P+ 及 其 领域 具有 某 种 不 变 的 特性 ， 则 与 该 像 点 
Pr 对 应 的 右 图 像 上 的 像 点 Pr 及 其 领域 也 具有 同一 种 不 变 特性 。 如 果 两 个 匹配 基 元 确实 是 由 
同一 物 点 产生 的 ， 那 么 它们 就 可 以 匹配 起 来 ， 反之 就 不 能 匹配 。 在 判断 两 个 匹配 基 元 是 否 相 
容 时 要 根据 它们 之 间 的 相似 性 。 

相似 性 度量 指 用 什么 度量 来 确定 待 匹 配 基 元 之 间 的 相似 性 。 在 立体 匹配 中 判断 匹配 的 好 
坏 ， 选 取 适 当 的 相似 性 度量 至 关 重 要 。 可 以 将 相似 性 的 假设 分 为 两 种 。 一 种 是 基于 光度 学 不 
变性 的 ， 即 左 、 右 图 像 对 应 区 域 中 灰 度 的 变化 情况 相似 ， 如 果 景 物 中 表面 的 深度 变化 比较 平 
缓 ， 两 台 摄 像 机 的 基线 距离 不 大 时 作 这 样 的 假设 是 有 道理 的 。 男 一 种 相似 性 的 假设 是 根据 几 
何 学 不 变性 ， 即 两 幅 图 像 中 描述 对 象 的 几何 结构 相同 。 例 如 ， 在 以 边缘 作为 匹配 基 元 时 沿 外 
极 线 上 任何 扫描 方向 在 左 、 右 图 像 中 边缘 出 现 的 次 序 相 同 ， 图 像 边 缘 可 用 其 切线 方向 、 法 线 
方向 、 位 置 和 强度 等 信息 描述 不 同 几 何 特征 的 特征 矢量 。 通 过 确定 两 特征 矢量 的 相似 性 来 确 
定 两 个 特征 点 区 域 是 否 匹 配 ， 通 党 是 基于 这 一 假设 的 关键 问题 。 

但 应 该 注意 的 是 ， 该 约束 只 是 当 被 选择 的 图 像 特征 具有 不 变 特 性 时 才 有 效 。 例 如 ， 对 于 
镜面 表面 而 言 ， 如 果 还 是 选择 灰 度 作为 图 像 特性 的 话 ， 将 会 遭遇 到 困难 。 因 此 ， 要 特别 注意 
图 像 特征 的 选择 ， 只 有 当中 同一 个 物 点 及 其 领域 的 点 在 左 、 右 图 像 平面 上 产生 的 投影 像 而 派 
生出 来 的 图 像 特征 具有 某 种 不 变 的 特性 (或 某 种 相似 性 ) 时 ， 才 可 以 被 用 来 在 左 、 右 图 像 平 
面 上 的 像 点 之 间 建 立 所 谓 的 对 应 关系 。 这 种 不 变 特 性 可 以 是 基于 物理 量 的 ， 也 可 以 是 基于 几 
何 形状 的 ， 视 具体 问题 而 定 。 

2. 连续 性 约束 

连续 性 约束 条 件 的 含义 是 指 ， 除 了 在 物体 边界 处 的 深度 不 连续 的 地 方 ， 匹 配 得 到 的 视差 
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值 的 变化 几乎 处 处 平滑 。 这 个 约束 条 件 是 以 下 述 假设 为 前 提 的 : 与 表面 到 摄像 机 的 距离 相 
比 ， 物 体 表面 凹凸 引起 的 变化 或 由 摄像 机 到 物体 表面 的 距离 变化 造成 的 差异 都 很 小 ， 因 此 物 
体 表面 可 看 成 是 平滑 的 ， 也 就 是 说 除了 物体 的 边界 外 ， 从 观察 者 到 可 见 表面 的 距离 的 变化 是 
连续 的 。 根 据 以 上 的 约束 条 件 可 以 在 一 定 程 度 上 限定 共 斩 点 的 搜索 范围 ， 减 少 对 应 点 匹配 的 
歧义 性 。 考 虑 视差 值 的 连续 性 ， 将 连续 性 约束 条 件 可 以 分 为 两 类 绝对 视差 连续 约束 、 相 对 
视差 连续 约束 。 

(1) 绝 对 视差 连续 约束 

对 于 特定 的 双 目 视觉 传 感 咒 模型 ， 两 台 摄 像 机 相对 位 移 和 旋转 角度 基本 为 一 个 特定 值 。 
因此 ， 在 特定 的 物体 上 同一 物 点 在 两 幅 图 像 上 的 投影 点 位 置 相差 ( 即 视 差 值 ) 在 一 定 范 围 内 。 
对 候选 匹配 的 两 个 特征 点 P+ 和 Pr' 设 定 最 大 视差 半径 ， 如 果 两 个 特征 点 之 间 的 距离 大 于 这 
个 半径 ， 则 令 m, =0，Pr 和 Pr 之 间 的 无 匹配 关系 ， 即 

1 dB, PI) xd. 
“lo 其 他 
































(7. 58 ) 


式 中 ，d, 为 视差 阔 值 。 
(2) 相 对 视差 连续 约束 
令 刀 下、 站、 天 分别 为 两 幅 图 像 刻 和 大 的 特征 点 ， 如 果 Pr 、P! 分 别 为 PR、Pr 的 

正确 匹配 点 ， 并 且 P! 与 P 位 置 接近 ， 忆 与 Pr 位 置 也 接近 。 基 于 场景 点 相对 位 置 的 惟一 

性 ， 在 各 自 图 像 坐 标 系 下 ， 特 征 点 Pr、P; 相对 位 置 矢量 4 = 应 于 与 特征 点 pr 、Pr 的 相对 

位 置 矢量 必 = Pr 应当 相 近 ， 两 者 的 相似 性 可 通过 cos(Ab) 来 衡量 。 

dd 


In 














cos(A0) = 





(7. 59 ) 


a i x es Ns 
式 中 ，Ab 为 矢量 夹 角 ; | |, 为 矢量 的 2 - 范 数 ， 表 征 矢量 的 长 度 。cos(Ab) 表 征 了 两 对 特 
征 点 构造 的 矢量 之 间 的 夹 角 的 大 小 ， 反 应 了 相对 视差 的 一 致 性 。 如 果 cos(Ab) >0， 说 明 匹 
配点 对 Pi、P; 与 站、 有 站 是 视差 一 致 的 ， 且 cos(Ab) 的 大 小 反应 了 一 致 的 程度 。 相 反 地 ， 
如 果 cos( A9) <0 认为 两 对 匹配 点 是 视差 冲突 的 ， 两 台 摄像 机 相对 位 移 和 旋转 角度 基本 为 一 
特定 值 时 ，| 7 、1 灾 1; 大 小 应 该 存在 一 定 的 比例 关系 。 

相对 视差 约束 实际 上 也 构成 了 单调 性 约束 ， 沿 着 匹配 点 的 共 斩 极 线 ， 所 有 场景 可 见 点 都 
保持 同样 的 次 序 。 即 匹配 点 在 两 幅 图 像 中 的 先后 顺序 必须 一 致 。 这 样 可 以 简化 对 应 问题 。 

3. 惟一 性 约束 

惟一 性 约束 指 某 个 匹配 点 只 能 与 另 一 幅 图 像 中 的 一 个 匹配 点 相 匹配 ， 这 样 图 像 中 每 个 匹 
配点 最 多 只 能 有 一 个 视差 值 。 即 两 幅 图 像 中 的 匹配 必须 惟一 。 

注意 ， 在 景物 为 半 透 明 表 面 的 情况 下 ， 该 约束 不 一 定 成 立 。 另 外 ， 该 约束 不 要 求 左 图 像 
上 的 每 一 个 像 点 均 在 右 图 像 上 存在 相应 的 对 应 点 ， 反 之 亦 然 。 事 实 上 ， 当 一 个 物体 被 别 的 物 
体 或 自身 遮挡 的 时 候 ， 可 能 存在 对 于 某 一 方 图 像 上 的 一 些 像 点 在 另 一 方 的 图 像 上 找 不 到 对 应 
点 的 情况 。 

4. 视线 的 约束 

如 果 一 个 物 点 P 在 图 像 平 面 上 形成 一 个 像 点 已 ， 则 该 物 点 必定 在 由 相应 的 像 点 已 所 确 
定 的 视线 0P, 上。 
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例如 ， 如 图 7.17 所 示 ， 如 果 已 知 左 图 像 平 面 上 的 一 个 像 点 P+， 则 根据 此 约束 条 件 可 
知 ， 相 应 的 物 点 P 必定 躺 在 视线 OP 上 。 但 是 ， 无 法 知道 物 点 P 在 视线 忆 上 的 确切 位 置 。 
事实 上 ， 仪 根据 此 约束 条 件 ， 视 线 OP; 上 的 任意 一 点 均 有 资格 作为 待 求 物 点 了 的 候补 。 

男 一 方面 ， 如 果 已 知 一 个 物 点 在 空间 的 确切 位 置 ， 则 该 物 点 在 图 像 平面 上 的 投影 像 由 下 
述 约 束 条 件 确定 。 

5. 成 像 几何 的 约束 

如 果 有 一 个 物 点 已 ,并且 该 物 点 己 在 观测 图 像 平 面 上 给 出 一 个 投影 像 点 已 ， 则 该 像 点 
P; 在 图 像 平面 上 的 位 置 由 透视 投影 的 关系 式 惟一 地 确定 。 

利用 上 面 两 个 基本 几何 约束 条 件 ， 可 以 导出 在 实际 中 寻求 和 左 图 像 平面 上 的 某 个 像 点 所 
对 应 的 右 图 像 平面 上 的 像 点 时 非常 有 用 的 一 个 约束 条 件 ， 即 所 谓 的 外 极 约束 。 

如 图 7. 17 所 示 ， 现 在 希望 在 右 图 像 平面 上 确定 左 图 像 平面 上 的 像 点 Pr 的 对 应 点 Pi。 
由 关于 视线 的 约束 条 件 可 知 ， 在 左 图 像 平面 上 产生 像 点 忆 的 物 点 P 必定 在 左 摄 像 机 的 光学 
中 心 0 和 投影 像 Pr 的 连 线 OP; 上 。 但 是 ， 其 位 置 无 法 确定 。 可 能 是 点 P， 也 可 能 是 点 已、 
P,、P; 中 的 某 一 点 ， 或 在 连 线 OP; 上 的 其 他 任意 一 点 。 不 论 是 在 哪 一 点 ， 一旦 接受 了 这 一 
点 ， 则 该 点 在 右 图 像 平 面 上 的 像 点 必须 由 关于 几何 成 像 的 约束 条 件 所 惟一 地 确定 。 显 然 ， 这 
些 像 点 落 在 由 直线 OP; 和 右 摄像 机 的 光学 中 心 0' 所 确定 的 平面 上 。 男 一 方面 ， 这 些 像 点 是 
右 图 像 平面 上 的 像 点 ， 自 然 必须 处 于 右 图 像 平面 上 。 这 样 ， 综 合 上 面 的 讨论 可 知 ，P; 的 对 
应 点 Pr 必定 在 上 述 两 个 平面 上 的 交 线 PP 上。 

6. 顺序 约束 

如 果 左 图 像 上 的 像 点 Pr 在 男 一 个 像 点 户 ; 的 左边， 则 右 图 像 上 与 像 点 Pr 匹配 的 像 点 
Pr 也 必须 在 与 像 点 PF, 匹配 的 像 点 P 的 左边 。 

这 是 一 条 启发 式 的 约束 ， 并 不 总 是 严格 成 立 的 。 例 如 ， 出 现在 双 区 域 错觉 (Two Block ll- 
lusion) 现象 的 情况 下 就 不 是 严格 成 立 的 。 在 实际 应 用 该 约束 条 件 时 ， 应 注意 到 这 一 点 。 


















































7. 10 ” 双 目 视觉 测量 特征 匹配 算法 介绍 


除了 上 面 介 绍 的 约束 条 件 之 外 ， 为 了 最 终 在 左 、 右 图 像 平 面 上 的 像 点 之 间 建 立 起 某 种 对 
应 关系 ， 对 于 视觉 测量 而 言 一 般 都 是 采用 稀 玖 匹配 ， 即 对 两 幅 图 像 所 具有 的 特征 之 间 进 行 某 
种 匹配 运算 。 显 然 ， 作 为 进行 匹配 运算 的 图 像 特征 应 该 具有 某 种 不 变 特性 。 特 征 点 匹配 算法 
严格 意义 上 可 以 分 成 三 步 : 特征 提取 、 特 征 匹 配 和 消除 不 良 匹 配点 。 特 征 匹 配 不 直接 依赖 于 
灰 度 ， 具 有 较 强 的 抗 干扰 性 。 该 类 方法 首先 从 待 匹 配 的 图 像 中 提取 特征 ， 用 相似 性 度量 和 一 
些 约束 条 件 确定 几何 变换 ， 最 后 将 该 变换 作用 于 待 匹 配 图 像 。 

根据 所 使 用 图 像 特征 空间 形态 上 的 不 同 ， 这 些 方法 大 致 可 分 为 基于 基 元 特征 的 方法 和 基 
于 区 域 特征 的 方法 两 大 类 。 基 于 基 元 特征 的 方法 把 图 像 中 的 边缘 点 、 角 点 、 描 点、 交叉 点 、 
直线 段 和 曲线 段 等 作为 图 像 特 征 进行 匹配 运算 ,而 基于 区 域 特征 的 方法 则 通过 计算 不 同 图 像 
的 对 应 区 域 之 间 在 灰 度 或 彩色 、 轮 廊 、 纹 理 上 存在 的 相关 性 实现 图 像 特征 间 的 匹配 。 

下 面 ， 给 出 具有 代表 性 的 匹配 算法 。 
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7. 10.1 基于 兴趣 点 的 匹配 算法 


假定 采用 图 7. 17 所 示 的 典型 摄像 机 设置 ， 并 利用 图 像 中 的 边缘 点 作为 图 像 特征 。 此 时 ， 
采用 前 述 的 外 极 约束 能 使 整个 匹配 过 程 得 以 简化 。 显 然 ， 对 于 左 图 像 某 一 扫描 行 上 的 一 个 特 
征 点 Pr 而 言 ， 由 于 其 在 右 图 像 上 的 相应 的 外 极 线 与 右 图 像 中 具有 相同 行 指标 的 扫描 行 重合 。 
因此 ， 仅 需 在 右 图 像 上 的 同一 扫描 行 上 探索 其 对 应 点 Pi。 男 外 ,根据 前 述 的 相 容 性 约束 ， 
该 对 应 点 Pi 也 应 为 一 特征 点 。 不 仅 如 此 ， 上 述 两 个 特征 点 的 幅 值 和 方向 也 应 该 保持 一 致 。 
这 样 ， 综 合 上 面 的 讨论 ， 可 得 到 基于 特征 点 的 匹配 算法 如 下 : 

输入 图 像 ， 左 特征 点 图 像 eL(i, 万、 右 特征 点 图 像 es(i, 让, 1<i<1, 1<j<J。 

输出 图 像 : 视差 图 像 d(i, 站, 1<i<1, 1<j<J。 







































































大 二 标记 : 
i 一 一 左 图 像 的 现行 行 指标 ; 
站 一 一 右 图 像 的 现行 行 指标 ; 
太一 一 左 图 像 的 现行 列 指标 ; 
太一 一 右 图 像 的 现行 列 指标 。 
算法 步骤: 


(1) 完成 初始 化 操作 

将 d(i, 站 清 零 ， 并 置 计 =1, 机 =1, 记 =1 和 如 =1。 

(2) 进行 匹配 算法 

1) 从 左 特 征 点 图 像 的 第 i 行 的 现行 列 位 置 开 始 ， 找 到 下 一 个 待 匹配 的 特征 点 P+。 显然 ， 
P; 的 列 指标 由 六 指示 。 

2) 在 右边 缘 图 像 的 第 i =ii 行 上 ， 寻 找 其 对 应 点 Pr。 方 法 是 ， 比 较 候 补 边缘 点 和 P; 的 
幅 值 与 方向 看 其 是 否 一 致 。 如 果 需 要 的 话 ， 也 可 引入 顺序 约束 以 进一步 减少 匹配 和 运算。 上 述 
过 程 不 断 进 行 直到 在 右 图 像 上 找到 具有 最 大 一 致 性 的 特征 点 为 止 ， 并 将 其 定 为 Pr 的 对 应 点 
Pr。 显然 ,该 Pi 的 列 指标 由 六 指示 。 然 后 ， 根 据 j 和 六 的 值 计算 待 匹配 的 特征 点 Pr 处 对 
应 的 时 差 ， 即 令 d(i, 站 = 记 -及 。 一 旦 右 图 像 上 的 一 个 特征 点 被 定 为 左 图 像 上 的 一 个 特征 点 
的 对 应 点 ， 则 根据 惟一 性 约束 ,该 点 以 后 将 不 能 和 左 图 像 上 任何 别 的 边缘 点 相 匹 配 。 

3 ) 进行 行 终止 检查 。 若 左 图 像 的 行 上 已 无 竺 匹配 的 特征 点 ， 去 (3); 否则 ， 回 到 (2) 中 
1) 。 

(3) 逐个 匹配 

若 羡 = 1/， 去 (4) ; 否则 ， 令 计 = +1、 矿 =1 和 = 加 回 到 (2) 中 1)。 

(4) 计算 边缘 点 

根据 视差 图 像 4(i, j) 和 摄像 机 的 系统 参数 ， 计 算 各 边缘 点 处 的 三 维 坐标 。 

该 算法 的 特点 是 仅 在 图 像 的 特征 点 处 可 以 获得 相应 景物 的 三 维 位 置信 息 。 


7. 10. 2 ”基于 固定 滑 窗 区 域 的 匹配 算法 


和 基于 边缘 点 的 匹配 算法 一 样 ， 假 定 采用 图 7. 17 所 示 的 摄像 机 设置 ， 但 取 图 7. 20 所 示 
的 矩形 区 域 中 的 灰 度 分 布 作为 图 像 特 征 。 此 时 ， 利 用 外 极 约束 同样 可 使 整个 匹配 过 程 得 到 简 
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化 。 


左 图 像 右 图 像 
窗 宽 2w+1 








图 7.20 基于 滑动 窗口 的 特征 匹配 算法 
如 图 7.20 所 示 , 左 、 6 窗口 区 域 的 相似 性 程度 由 如 下 误差 函数 给 出 : 
py 2 hx) -f(x + dy) 
1 i (7.60) 
厅 > 六 (x,y) 
式 中 ,误差 函 数 (i，j，d) 的 值 越 小 ， 相 应 窗口 区 域 的 相似 性 程度 越 高 。 


类 似 地 ， 也 可 以 定义 如 下 所 示 的 相关 函数 来 衡量 左 、 右 图 像 中 的 相应 窗口 的 相似 性 程 
度 ， 有 

















a 2 之 (zz + dy) 


Bre /EE 
此 时 ， 相 关 函 数 R(i，j，d) 的 值 越 大 ， 相 应 窗口 区 域 的 相似 性 程度 越 高 。 
具体 的 匹配 算法 如 下 : 
输入 图 像 : 左 灰 度 图 像 f(x，y) 、 石 灰 度 图 像 f(i, 门 , 1<i<1, 1<j<jJ。 
输出 图 像 : 视差 图 像 d(i, 7 1<i=<I, 1<j<J。 





R(i,,d) = 





(7.61) 




















才干 标记 : 

i 一 一 左 图 像 的 现行 行 指标 ; 
一 一 右 图 像 的 现行 行 指标 ; 
三 一 一 左 图 像 的 现行 列 指标 ; 
六 一 一 右 图 像 的 现行 列 指标 ; 








一 人 定 吕 的 5 度 指标 ; 

















固定 窗 放 指 标 。 
ww 
(1) 完 成 初始 化 操作 


将 d(i, 让 清 零 ， 并 置 i =v+1, ih =v+1 和 ji =w+1。 
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(2) 进 行 匹 配 算法 

1) 在 右 图 像 的 第 去 =ii 行 上 寻找 与 左 图 像 上 的 当前 像素 Pr =fi (ii，, 广 ) 最 相似 的 对 应 点 
Pr。 方法 如 下 :以 固定 尺寸 的 窗口 套 住 当前 像素 Pi， 并 让 同一 尺寸 的 窗口 顺序 滑 过 右 图 像 
的 第 记 行 ， 在 每 一 个 像素 位 置 ， 计 算 由 式 (7.60) 定 义 的 误差 函数 (ii, 让，d) [也 可 计算 由 
式 (7.61) 定 义 的 相关 的 函数 R(ii，, 六 ，d) ] ， 直 到 在 右 图 像 上 找到 最 相似 的 像素 点 P! 为 止 ， 
并 将 P; 定 为 Pr 的 对 应 点 ; 车 Pi 的 列 指标 由 六 指示 ， 那 么 置 d(i, 访 = 广 =- 六; 一 旦 右 图 像 
上 的 一 个 像素 点 被 定义 为 左 岁 像 上 的 一 个 像素 点 的 对 应 点 ， 则 根据 惟一 性 约束 ， 该 点 以 后 将 
不 能 和 左 图 像 上 任何 别 的 像素 点 相 匹 配 。 同 样 地 ， 也 可 引入 顺序 约束 以 进一步 减少 匹配 运 
算 。 

2 ) 进行 行 终止 检查 。 若 六 =J-w， 去 (3); 否则 ， 令 六 = 六 +1， 回 到 1)。 

(3) 逐 个 匹配 

奉 读 =1-v， 去 (4); 否则 ， 信访 =jL+1、 in=ir +1 入 =w+1， 回 到 (2) 中 1)。 

(4) 计算 边缘 点 

根据 视差 图 像 4(i, j) 和 摄像 机 的 系统 参数 ， 计 算 各 边缘 点 处 的 三 维 坐标 。 该 算法 的 特 
点 是 在 图 像 的 所 有 像素 位 置 处 均 可 获得 相应 景物 的 三 维 位 置信 息 。 


7. 10.3 ”基于 形状 模板 的 匹配 算法 


模板 匹配 方法 在 计算 机 视觉 和 模式 识别 等 领域 中 的 应 用 也 非常 广泛 ， 通常 可 以 分 为 刚体 
形状 匹配 和 变形 模板 匹配 两 大 类 。 在 刚体 形状 匹配 中 ， 原 型 模板 通过 平移 、 旋 转 和 尺度 化 等 
简单 变换 达到 和 目标 图 像 的 匹配 。 但 当 目 标 形状 发 生 较 大 变形 时 ， 结 果 往 往 不 理想 。 通 常 将 
变形 模型 分 为 自由 式 变形 模型 和 参数 式 变形 模型 。1988 年 kass 等 人 提出 的 基于 能 量 函 数 的 
活动 轮廓 模型 ( Active Contour Model) ， 即 Snake 模型 ， 便 是 一 种 典型 的 自由 式 变形 模板 模 
型 。Snake 模型 是 一 种 有 效 地 寻找 目标 轮廓 的 搜索 算法 ， 具 有 良好 的 提取 、 跟 踪 特 定 区 域内 

目标 边缘 的 能 力 ， 工 作 过 程 主要 是 利用 能 量 最 小 化 原理 。 其 能 量 函 数 定义 为 
E = [ (B,, + Bi + Bo) ds (7..62) 


式 中 , 了 为 轮廓 曲线 ; A, 为 Snake 模型 的 内 部 能 量 函 数 ， 保 持 Snake 模型 的 连续 性 和 光滑 
性 ; ,为 关于 输入 图 像 的 能 量 ， 表 示 边 缘 、 线 条 的 特征 ; 已 .为 赋予 Snake 模型 的 外 部 控 
制 能 量 ， 体 现 了 强加 的 外 部 约束 条 件 。 在 给 定 初始 轮廓 后 ， 正 是 在 这 三 种 能 量 的 驱使 下 最 终 
提取 一 条 闭合 的 目标 轮廓 。 实 现 Snake 模型 原型 的 算法 通常 十 分 复杂 ， 曲 线 收 敛 速度 慢 且 搜 
索 范 围 有 一 定 限 制 ， 因 此 许多 学 者 提出 了 不 同 的 算法 ， 对 经 典 Snake 模型 进行 了 改进 。 
参数 化 的 变形 模板 则 使 用 通过 确定 先 验 形 状 ， 用 少量 的 参数 来 表示 模板 ， 增 强 对 图 像 中 
目标 的 捕捉 范围 和 对 目标 的 弱 边 界 、 凹 陷 区 域 或 含 噪 图 像 的 分 割 能 力 。 通 党 通过 引进 非 距 离 
性 的 先 验 形状 力 场 ， 避 人 免 曲 线 距 离 计 算 ， 减少 模型 复杂 度 ， 这 样 可 以 较 好 地 解决 传统 活动 轮 
廓 模型 的 一 些 本 质 缺 陷 。 在 这 里 有 两 种 方法 用 来 表示 参数 化 变形 模板 : 中 用 参数 化 曲线 的 集 
合 表 示 ， 模 板 的 几何 形状 通过 改变 参数 值 而 改变 ; @ 参 数 映 射 下 的 原型 模板 图 像 ， 它 通过 指 
定 一 个 原型 模板 来 描述 一 类 目标 的 形状 ， 该 类 目标 的 各 种 形状 都 是 通过 对 原型 进行 参数 映射 
而 得 到 的 ， 不 同 的 参数 值 可 以 得 到 不 同 的 形状 。 变 形 模板 通过 图 像 力 动态 调整 参数 达到 和 图 
像 特 征 之 间 的 交互 作用 。 和 主动 轮廓 模型 相似 ， 参 数 式 变 形 模板 用 内 部 能 量 和 外 部 能 量 的 加 
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权 与 构成 的 目标 函数 确定 一 个 变形 模板 和 给 定 图 像 中 目标 的 匹配 程度 。 


7. 10. 4 


基于 边缘 特征 的 匹配 算法 








边缘 是 图 像 基本 特征 之 一 ， 是 图 像 中 两 个 具有 不 同 灰 度 的 均匀 区 域 的 边界 。 它 反映 灰 度 


的 突变 。 
信息 丰富 
要 的 意义 


图 像 边 缘 可 用 其 切线 方向 、 法 线 方向 、 位 置 和 强度 等 信息 描述 。 由 于 边缘 是 图 像 的 
区 域 ， 且 较 少 随 图 像 的 几何 变换 而 丢失 或 改变 ， 因 此 边缘 检测 在 图 像 匹配 中 具有 重 
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